MiniMax-M3 开源实测:部署、推理与基准测试全记录 - GPUStack

Wait 5 sec.

【摘要】MiniMax-M3 是 MiniMax 最新开源的原生多模态大模型,约428B 总参数/23B激活参数,原生支持1M上下文。本文基于 GPUStack 与VLLM,演示从镜像与权重准备、模型部署、对话实测到基准测试的完整流程,并实测了基于 EAGLE3 的投机解码加速。 阅读全文