新浪科技讯 2月13日上午消息 ,发布MiniMax上线新一代文本模型MiniMax M2.5。比肩在编程能力方面,输入M2.5在权威榜单SWE-Bench Verified得分80.2%、价格光刻机技术Multi-SWE-Bench得分51.3%,约美元百较上一代显著提升;在Multi-SWE-Bench等多语言复杂环境中超越Opus 4.6 ,发布达到了行业最好的比肩水平。更重要的输入是,模型展现出“原生Spec能力”——在编码前主动拆解架构与功能规划 ,价格更接近真实架构师的约美元百工作模式 。
在工具调用和搜索能力方面 ,发布数字经济模型能够自动处理复杂任务 ,比肩在BrowseComp、输入Wide Search等多项 Agent 任务中以更低的价格轮次消耗取得了更优的效果 ,相较于上一代模型表现提升20% ,约美元百达到了行业顶尖水平 。跨境电商
办公场景中,在 Word、PPT 、Excel 金融建模等 Workspace 高阶场景中取得了显著的能力提升,在测评框架GDPval-MM与主流模型的直播电商对比取得了 59.0%的平均胜率。
性能之外 ,M2.5的另一核心亮点在于极致的推理速度与成本控制。M2.5-lightning版本支持100 TPS以上输出速度,是主流模型的2倍左右;输入价格约0.3美元/百万Token,输出约2.4美元/百万Token。前沿科技按每秒输出100 Token计算