这次会不会有14B的AutoAWQ或者GPTQ?

#2
by lingyezhixing - opened

快速翻译还是得靠vllm或者lmdeploy,llama.cpp的并发吞吐和prefill还是有点差

SakuraLLM org

正式版会有,测试版因为还在迭代中不能保证次次都有

Sign up or log in to comment