爆发式增长 飙涨超千倍 企业加码布局
2026-05-31
2026-06-03 0
2026年6月,新一代尖端大模型MiniMax M3正式发布,标志着国产AI技术在代码生成与多模态领域取得重大突破。

针对智能体在复杂任务中的上下文扩展挑战,M3创新性地采用了自研稀疏注意力机制(MSA)。该技术通过优化KV分块策略和深度算子级设计,显著提升了计算效率:相比主流开源方案,推理速度提升超过4倍;在处理1M长度上下文时,单Token计算开销仅为前代模型的1/10,预填充和自回归解码阶段分别实现了9倍和15倍以上的加速。

基于百亿亿级交错结构化数据的联合训练,M3在语义表征方面实现了高度统一与泛化。在SWE-Bench Pro等权威测试中,其性能全面超越GPT-5.5与Gemini3.1Pro。特别值得一提的是,M3展示了惊人的长周期自主能力:连续12小时独立复现ICLR论文实验流程,并在零参考代码条件下稳定运行24小时,调用外部工具近2000次,成功将Hopper架构上FP8精度矩阵乘法的硬件利用率从7.6%提升至71.3%。
与M3同时发布的还包括专为长周期开发定制的MiniMax Code智能体平台,以及高性价比的Token订阅和API服务。官方承诺将在10日内全面开源模型权重。M3的问世不仅打破了国内对海外闭源方案的依赖,更以全栈开源的方式重新定义了国产大模型的发展路径。