头像

枝鱼

帅气的我简直无法用语言描述!

基于VLLM部署deepseek多机多卡分布式推理

背景 机器:4节点,每节点2张A40 操作系统:RockyLinux9.5 Ollama只能在单机运行deepseek,无法利用多机进行分布式推理。 尝试基于ray + VLLM进行deepseek部...
头像3周前
000