请求一下这个分支https://github.com/doctorpangloss/forks-vllm-ampere/tree/ampere-v4-upstream-merge-20260519 应该使用那个模型来进行部署呢,是使用https://huggingface.co/appmana/deepseek-v4-int4-int8还是官方的
请求一下这个分支https://github.com/doctorpangloss/forks-vllm-ampere/tree/ampere-v4-upstream-merge-20260519 应该使用那个模型来进行部署呢,是使用https://huggingface.co/appmana/deepseek-v4-int4-int8还是官方的