墨风如雪博客

  • 源码小店
  • 传家宝VPS
让AI使用变得如此简单
  1. 首页
  2. AI
  3. 正文

1美元雇佣顶级架构师?MiniMax M2.5要把Agent价格打穿

2026年 2月 13日 11点热度 0人点赞 0条评论

2026年的AI春节档刚过,MiniMax就扔出了一枚重磅炸弹。

2月13日,MiniMax M2.5正式上线。这一次,他们没有像往常那样单纯去卷参数量或者在这个榜那个榜上争个你死我活,而是把枪口对准了一个更现实、更痛的问题:怎么让AI Agent真的用得起,而且真的能干活。

这就好比以前我们都在比谁家的法拉利跑得快,但MiniMax突然造出了一辆跑得比法拉利还快,但油耗只有五菱宏光的车。

GDFGD

告别“码农”,迎来“架构师”

过去的大模型在写代码时,往往像个听话的初级程序员:你给一个指令,它写一段代码。一旦需求复杂,它就开始胡编乱造。

M2.5最大的进化在于它演化出了“原生Spec能力”。简单来说,它在动手写代码之前,会先像在这个行业摸爬滚打多年的架构师一样,进行拆解和规划。

数据不会撒谎。在公认最硬核的编程榜单 SWE-Bench Verified 上,M2.5拿到了 80.2% 的分数。这不仅是SOTA(当前最佳)水平,更是在多语言任务(Multi-SWE-Bench)上以 51.3% 的成绩拿下了全球第一,直接把Claude Opus 4.6甩在身后。

这意味着,它不再是一个只能补全代码的插件,而是一个能独立处理复杂工程、甚至能自己改Bug的虚拟员工。

FSDAFSAD

算一笔让老板心动的账

如果不谈成本,谈AI落地都是耍流氓。M2.5最可怕的地方不在于它有多聪明,而在于它把“聪明”变得极其廉价。

来看看这个离谱的经济模型:

  • 推理速度:100 TPS(每秒处理100个token),是目前主流模型的2倍。
  • 运行成本:如果你让它全速运转(100 TPS),一小时的成本仅为 1美元。如果你不需要那么快(50 TPS),一小时只要 0.3美元。

MiniMax给出了一个非常具象的换算:给你1万美元预算,你可以雇佣4个由M2.5驱动的顶尖Agent,让它们不眠不休地连续工作整整一年。

相比之下,Claude Opus、GPT-5等模型的成本是它的10倍甚至20倍。对于想要规模化部署Agent的企业来说,这不仅仅是省钱,而是把“不可行”变成了“可行”。

gsdf

既然这么强,MiniMax自己用了吗?

很多模型厂商发布产品时吹得天花乱坠,自己内部开发却还要靠别人的模型。但MiniMax这次搞了一波“吃自己的狗粮”。

根据官方披露的数据,M2.5已经全面渗透进了MiniMax的内部业务。现在,他们内部 30% 的整体任务完全由M2.5自主完成,覆盖了从产品、销售到财务的各个环节。

更夸张的是在研发端:MiniMax新提交的代码中,有80%是由M2.5生成的。 这不是辅助,这是主力。

GSDFG

技术背后的“暴力美学”

为什么M2.5能在这个时间点实现性能和成本的双重突围?

核心在于技术底座的重构。过去108天,MiniMax把模型从M2迭代到了M2.5,这背后是他们自研的Forge框架和大规模强化学习(RL Scaling)在发力。

他们并没有单纯堆砌参数(激活参数量仅10B),而是通过CISPO算法和过程奖励机制,让模型学会了“精打细算”。它知道在什么地方该深思熟虑(Thinking Token),在什么地方该快速掠过。结果就是,在BrowseComp等搜索任务中,它的轮次消耗减少了20%,但任务完成速度却比上一代快了37%。

写在最后

MiniMax M2.5的发布,其实释放了一个信号:大模型正在从“炫技时代”进入“务实时代”。

当一个模型具备了架构师级别的思考能力,同时价格低到像水电一样时,所谓的“原生Agent”就不再是一个营销概念,而是真正能跑在每一个服务器、每一台PC甚至每一个APP里的生产力。

对于开发者和企业来说,现在的门槛不再是技术,而是想象力。毕竟,当雇佣一个顶级专家的成本只要几毛钱时,你还有什么理由不让他去干活呢?


如果你也对最新的AI信息感兴趣或者有疑问 都可以加入我的大家庭 第一时间分享最新AI资讯、工具、教程、文档 欢迎你的加入!!!😉😉😉

公众号:墨风如雪小站

wx
  • 我的博客:https://blog.worldcodeing.com/
  • 传家宝VPS:https://www.legacyvps.com/
  • 源码小站:https://www.worldcodeing.com/
本作品采用 知识共享署名 4.0 国际许可协议 进行许可
标签: MiniMax M2.5
最后更新:2026年 2月 13日

墨风如雪

一个热爱生活,热爱分享的程序员

打赏 点赞
< 上一篇

墨风如雪

一个热爱生活,热爱分享的程序员

最新 热点 随机
最新 热点 随机
1美元雇佣顶级架构师?MiniMax M2.5要把Agent价格打穿 那个霸榜的Pony Alpha现身了:智谱GLM-5硬刚Claude Opus 纯国产算力硬刚GPT?聊聊刚发布的讯飞星火X2 阿里Qwen-Image-2.0实测:终于有一款能听懂人话、写对汉字的AI了 别再等Sora了,字节Seedance 2.0才是AI视频的“导演时刻” Mistral 掀桌子:40亿参数跑本地,Voxtral 2 把延迟压进了200毫秒
语音模型变天!阶跃星辰R1.1开源,96.4%胜率让GPT都沉默纯血国产的逆袭:GLM-Image如何用昇腾芯片霸榜Hugging Face8个大脑同时转?美团LongCat开源,让AI学会“三思后行”谷歌不装了:TranslateGemma发布,12B参数竟倒反天罡吊打前辈这才是AI建模该有的样子:混元3D 1.2公测,鼠标秒变雕刻刀智谱GLM-4.7-Flash实测:3B的激活量跑出30B的性能,本地部署变天了
打破次元壁垒!阿里Mnn3dAvatar让3D数字人触手可及 谷歌的大反击:Gemini 3 Flash 让“快”和“聪明”终于握手言和 设计模式:模板方法模式 Gemini 2.5 Pro:AI新王登基,炸裂来袭! 不一样的视角 解析NoSQL数据库 Apache CouchDB MiniMax Speech 2.5:当AI学会了你的口音,世界再无语言障碍
标签聚合
spring 教程 大模型 AI 开源 java 设计模式 算法

COPYRIGHT © 2023 墨风如雪博客. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang