快速翻译还是得靠vllm或者lmdeploy,llama.cpp的并发吞吐和prefill还是有点差
正式版会有,测试版因为还在迭代中不能保证次次都有
· Sign up or log in to comment