墨风如雪博客

  • 源码小店
  • 传家宝VPS
让AI使用变得如此简单
  1. 首页
  2. AI
  3. 正文

炸裂!MistralAI 新模型 Devstral-Small 来了:236亿参数,凭啥在软件工程榜单上碾压千亿巨头?

2025年 5月 22日 197点热度 0人点赞 0条评论

各位 AI 圈的朋友们,又是一个值得熬夜(或者刚刚睡醒刷到)的震撼消息!

以“小而美”著称的 MistralAI,就在刚刚过去的 4 小时,悄悄放出了他们的新家伙—— Devstral-Small-2505。光听名字就知道,这哥们是来搞开发的!参数量定在了 23.6B(236亿),这个数字在如今动辄几千亿、上万亿参数的大模型世界里,看起来不算是个“巨无霸”。

但是!MistralAI 的哲学向来是“以小博大”,这次,他们又把这句话狠狠地印在了大家脑门上。

Grfy4bYboAILHk8

Devstral-Small-2505 最炸裂的地方在哪里?

答案就在那个充满“血与火”的战场—— SWE-Bench Verified 基准测试。

这个 SWE-Bench Verified 可不是那种随便写写 hello world 的玩具测试,而是真刀真枪的实战!它包含了来自 GitHub 的 500 个真实的软件工程问题,从改 bug、写代码到理解复杂的项目概念,无所不包。能在上面得分,那真是得有两把刷子。

而我们的新同学 Devstral-Small-2505,就在这个硬核榜单上,砍下了 46.8% 的恐怖成绩!

46.8% 是什么概念?

这就是本文的真正高潮部分了,请大家坐稳!

根据 MistralAI 官方放出的信息,这个 23.6B 参数的小模型,在 SWE-Bench Verified 上,竟然超越了两家业界巨头、参数量远超自己的模型:

  • Qwen3-235B-A22B (参数量:2350亿! 是 Devstral 的十倍!)
  • DeepSeek-V3/R1 (参数量:可能基于 DeepSeek-V3 的 6710亿版本,参数量可能是 Devstral 的二十多倍!)

想象一下,一个身材苗条的选手,在专业技能比拼中,不仅追上了,还直接超车了那些重量级的拳王!Devstral-Small-2505 的 46.8% 得分,硬生生把那些几千亿、近万亿参数的模型压在了下面。

iShot_2025-05-22_23.11.50

这怎么可能?!

这无疑是给整个 AI 社区抛出了一个巨大的问号,但也再次印证了 MistralAI 一贯的技术路线的成功:

  1. 极致的效率优化: 参数量小,性能却强,说明模型架构、训练数据和训练方法必然有其独到之处。他们可能找到了在软件工程领域最高效捕捉知识的方式。
  2. 精准的领域专精: “Devstral”这个名字不是白叫的。模型显然针对软件工程任务进行了深度优化和微调。这告诉我们,有时候,“专才”比“全才”在特定领域更有杀伤力。
  3. 小模型,大未来: 参数量控制在 23.6B,意味着这个模型有潜力在单张高端 GPU 甚至性能强劲的消费级显卡上运行。如果 MistralAI 延续其开源传统(比如 Apache 2.0 许可证),这无疑会极大地降低开发者使用先进代码助手的门槛,让更多人能在本地享受到顶级 AI 的辅助。
iShot_2025-05-22_23.11.37

总结一下

MistralAI 的 Devstral-Small-2505,虽然名字里带着“Small”,但在软件工程这个专业赛道上,它已经证明了自己是当之无愧的“Big”!凭借 23.6B 参数,它在 SWE-Bench Verified 榜单上以 46.8% 的成绩,漂亮地击败了参数量远超自身的 Qwen3-235B-A22B 和 DeepSeek-V3/R1。

这不仅是 MistralAI 团队技术实力的又一次展示,也是对整个大模型领域的一种启发:参数量不是唯一的王道,高效、精准、领域专精同样能带来突破性的性能。

对于开发者来说,Devstral-Small-2505 无疑是一个值得高度关注的工具。它预示着更强大、更易于部署的 AI 编程助手即将到来。

具体的模型细节、如何获取以及更多使用场景,我们还得紧密关注 MistralAI 的官方后续发布。但可以肯定的是,Devstral-Small-2505 已经在软件工程的 AI 赛道上,投下了一颗重磅炸弹!

期待这个“小个子”在未来带给我们更多惊喜!


如果你也对最新的AI信息感兴趣或者有疑问 都可以加入我的大家庭 第一时间分享最新AI资讯、工具、教程、文档 欢迎你的加入!!!😉😉😉

公众号:墨风如雪小站

wx
  • 我的博客:https://blog.worldcodeing.com/
  • 我的导航站:https://nav.worldcodeing.com/
  • 源码小站:https://www.worldcodeing.com/
本作品采用 知识共享署名 4.0 国际许可协议 进行许可
标签: AI Devstral-Small 模型
最后更新:2025年 5月 22日

墨风如雪

一个热爱生活,热爱分享的程序员

打赏 点赞
< 上一篇
下一篇 >

文章评论

您需要 登录 之后才可以评论

墨风如雪

一个热爱生活,热爱分享的程序员

最新 热点 随机
最新 热点 随机
让AI视频开口说话:腾讯混元Foley模型重塑视听体验 刷爆AI圈!字节Waver 1.0,统一视频生成新里程碑! 告别AI视频“幻觉”:群核SpatialGen,3D生成驶入“真空间”时代! 问小白o4:AI的“头脑风暴”时代来了! P图终结者?阿里通义新作,一句话让文字和像素俯首称臣 80亿参数撬动科学界,Intern-S1-mini不止是平替
OpenAI的“阳谋”:ChatGPT不想再当你枪手了别再迷信闭源模型,你桌面的AI推理之王已经诞生代码生成提速5.4倍!字节跳动这把剑,斩向GPT的“慢”时代告别塑料感:FLUX.1 Krea,那个让AI图像不再“AI”的模型月之暗面亮剑:Kimi K2 高速版,用速度与价格重塑牌局小米亮剑:快20倍的「顺风耳」,让人车家听懂全世界
昆仑万维扔出王炸:32B模型干翻671B,代码界迎来全能修理工! java 消息队列框架RocketMQ的(超详细总结) DeepWiki 开源版本:AI 帮你自动写代码 Wiki,告别手动苦海! java JVM垃圾回收器 Serial Collector、Parallel Collector、CMS Collector AI圈炸锅了!Mistral Medium 3:性能 SOTA,成本打骨折,企业玩家的新宠? 算力解放革命:Luma AI的Inductive Moment Matching如何让创意触手可及
标签聚合
大模型 算法 deepseek AI java 设计模式 spring 教程

COPYRIGHT © 2023 墨风如雪博客. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang