1美元雇佣顶级架构师？MiniMax M2.5要把Agent价格打穿

2026年 2月 13日 332点热度 0人点赞 0条评论

2026年的AI春节档刚过，MiniMax就扔出了一枚重磅炸弹。

2月13日，MiniMax M2.5正式上线。这一次，他们没有像往常那样单纯去卷参数量或者在这个榜那个榜上争个你死我活，而是把枪口对准了一个更现实、更痛的问题：怎么让AI Agent真的用得起，而且真的能干活。

这就好比以前我们都在比谁家的法拉利跑得快，但MiniMax突然造出了一辆跑得比法拉利还快，但油耗只有五菱宏光的车。

告别“码农”，迎来“架构师”

过去的大模型在写代码时，往往像个听话的初级程序员：你给一个指令，它写一段代码。一旦需求复杂，它就开始胡编乱造。

M2.5最大的进化在于它演化出了“原生Spec能力”。简单来说，它在动手写代码之前，会先像在这个行业摸爬滚打多年的架构师一样，进行拆解和规划。

数据不会撒谎。在公认最硬核的编程榜单 SWE-Bench Verified 上，M2.5拿到了 80.2% 的分数。这不仅是SOTA（当前最佳）水平，更是在多语言任务（Multi-SWE-Bench）上以 51.3% 的成绩拿下了全球第一，直接把Claude Opus 4.6甩在身后。

这意味着，它不再是一个只能补全代码的插件，而是一个能独立处理复杂工程、甚至能自己改Bug的虚拟员工。

算一笔让老板心动的账

如果不谈成本，谈AI落地都是耍流氓。M2.5最可怕的地方不在于它有多聪明，而在于它把“聪明”变得极其廉价。

来看看这个离谱的经济模型：

推理速度：100 TPS（每秒处理100个token），是目前主流模型的2倍。
运行成本：如果你让它全速运转（100 TPS），一小时的成本仅为 1美元。如果你不需要那么快（50 TPS），一小时只要 0.3美元。

MiniMax给出了一个非常具象的换算：给你1万美元预算，你可以雇佣4个由M2.5驱动的顶尖Agent，让它们不眠不休地连续工作整整一年。

相比之下，Claude Opus、GPT-5等模型的成本是它的10倍甚至20倍。对于想要规模化部署Agent的企业来说，这不仅仅是省钱，而是把“不可行”变成了“可行”。

既然这么强，MiniMax自己用了吗？

很多模型厂商发布产品时吹得天花乱坠，自己内部开发却还要靠别人的模型。但MiniMax这次搞了一波“吃自己的狗粮”。

根据官方披露的数据，M2.5已经全面渗透进了MiniMax的内部业务。现在，他们内部 30% 的整体任务完全由M2.5自主完成，覆盖了从产品、销售到财务的各个环节。

更夸张的是在研发端：MiniMax新提交的代码中，有80%是由M2.5生成的。 这不是辅助，这是主力。

技术背后的“暴力美学”

为什么M2.5能在这个时间点实现性能和成本的双重突围？

核心在于技术底座的重构。过去108天，MiniMax把模型从M2迭代到了M2.5，这背后是他们自研的Forge框架和大规模强化学习（RL Scaling）在发力。

他们并没有单纯堆砌参数（激活参数量仅10B），而是通过CISPO算法和过程奖励机制，让模型学会了“精打细算”。它知道在什么地方该深思熟虑（Thinking Token），在什么地方该快速掠过。结果就是，在BrowseComp等搜索任务中，它的轮次消耗减少了20%，但任务完成速度却比上一代快了37%。

写在最后

MiniMax M2.5的发布，其实释放了一个信号：大模型正在从“炫技时代”进入“务实时代”。

当一个模型具备了架构师级别的思考能力，同时价格低到像水电一样时，所谓的“原生Agent”就不再是一个营销概念，而是真正能跑在每一个服务器、每一台PC甚至每一个APP里的生产力。

对于开发者和企业来说，现在的门槛不再是技术，而是想象力。毕竟，当雇佣一个顶级专家的成本只要几毛钱时，你还有什么理由不让他去干活呢？

如果你也对最新的AI信息感兴趣或者有疑问都可以加入我的大家庭第一时间分享最新AI资讯、工具、教程、文档欢迎你的加入！！！😉😉😉

公众号：墨风如雪小站

本作品采用知识共享署名 4.0 国际许可协议进行许可