墨风如雪博客

  • 源码小店
  • 传家宝VPS
让AI使用变得如此简单
  1. 首页
  2. AI
  3. 正文

闭源的墙角被挖塌了?GLM-4.7登顶开源王座,这回真不兴嘲讽

2025年 12月 30日 164点热度 0人点赞 0条评论

2025年的年底并不平静。就在大家准备过双旦假期的时候,智谱AI像是故意给行业扔了个“深水炸弹”,发布了最新的GLM-4.7。

说实话,这两年国产大模型发布会我看累了,参数刷榜的消息也听麻了。但这次的情况有点不一样。这次拿出来的成绩单,不是自家做的PPT,而是来自Artificial Analysis。在这个被OpenAI、谷歌当做金标准的评测里,GLM-4.7干了一件让开源社区炸锅的事:它拿到了全球开源模型的第一名。

iShot_2025-12-30_00.17.07

这也太“卷”了

先看一张更有说服力的成绩单。在AAII(Artificial Analysis Intelligence Index)刚刚更新的榜单里,GLM-4.7拿到了68分的综合得分。

这个分数意味着什么?

往上看,它在全球总榜里排第六。排在它前面的,全是GPT-5.2、Gemini 3 Pro这种闭源巨头,也就是那种你每个月得掏20刀甚至更多才能用上的“贵族”模型。

往下看,这才是最有意思的地方。它把Claude 4.5 Sonnet、Grok 4这些名声在外的模型甩在了身后。而在开源这个赛道上,它直接登顶。就连同样表现生猛的DeepSeek V3.2,这次也以两分之差排在第十。

如果不谈开源闭源,单论国产模型,GLM-4.7和Kimi K2、DeepSeek共同构成的第一梯队,已经把国产AI的水平线硬生生拉到了国际一线。

iShot_2025-12-30_00.17.17

它到底强在哪?

很多开发者,包括我在内,最关心的其实不是分数,而是手感。GLM-4.7这次明显是奔着“解决难题”去的,它被定义为一款专注于推理的模型。

首先是写代码。对于我们这些靠代码吃饭的人来说,Code Arena的排名就是风向标。GLM-4.7在这个榜单上拿了开源第一,甚至在综合性能上压过了GPT-5.2。在LiveCodeBench测试里,它也超过了Claude Sonnet 4.5。虽然在某些特定测试集上还有偏科,但你让它写个复杂脚本或者查个Bug,它的表现已经不再是“像个AI”,而是“像个初级工程师”。

其次是它变“聪明”了。这里的聪明指的是逻辑推理。在研究生级别的GPQA Diamond测试里,它拿了84%的高分。为了达到这个效果,智谱给它引入了更长的思维链。简单说,就是它在回答你之前,会像人一样在肚子里打草稿,反复推演。虽然这会让计算成本稍微增加一点,但为了那个准确的答案,这点等待是值得的。

iShot_2025-12-30_00.17.23

还有一个亮点是“听指挥”。在考察智能体工具调用的测试中,它刷新了开源模型的纪录。这意味着,你可以更放心地把API接给它,让它去操作复杂的系统,而不是担心它听不懂指令乱搞一通。

不仅是榜单,更是风向

GLM-4.7发布后的反应很有趣。它不仅在国内火,在国外的Hugging Face上也迅速冲上了全球趋势榜第一。

这说明了什么?说明好东西是没有国界的。美国的AI推理平台Fireworks直接把它称作“了不起的假期礼物”,Vercel这种极客聚集的平台也第一时间宣布接入。

这不仅仅是一个模型的胜利,更像是一个信号。直到2024年,我们在讨论大模型时,还在说“追赶GPT-4”。到了2025年底,当我们看到国产模型在Hard模式的基准测试里,和谷歌、OpenAI的旗舰产品打得有来有回,甚至在开源领域领跑时,这种感觉是很微妙的。

iShot_2025-12-30_00.17.31

对于开发者和企业来说,这意味着选择权的转移。你不需要再为了高质量的推理能力去忍受昂贵的闭源API,GLM-4.7提供了一个高性价比、甚至可以说是廉价的替代方案——每百万token不到1美元的推理成本,配上开源第一的能力,这笔账谁都会算。

asfadfsd

总而言之,GLM-4.7的出现,让2025年的AI竞赛在终局阶段又充满了变数。对于我们使用者来说,这无疑是最好的时代。闭源的高墙还在,但地基已经被开源的铲子挖得越来越松动了。


如果你也对最新的AI信息感兴趣或者有疑问 都可以加入我的大家庭 第一时间分享最新AI资讯、工具、教程、文档 欢迎你的加入!!!😉😉😉

公众号:墨风如雪小站

  • 我的博客:https://blog.worldcodeing.com/
  • 传家宝VPS:https://www.legacyvps.com/
  • 源码小站:https://www.worldcodeing.com/
本作品采用 知识共享署名 4.0 国际许可协议 进行许可
标签: AI GLM-4.7 智谱
最后更新:2025年 12月 30日

墨风如雪

一个热爱生活,热爱分享的程序员

打赏 点赞
< 上一篇
下一篇 >

墨风如雪

一个热爱生活,热爱分享的程序员

最新 热点 随机
最新 热点 随机
1美元雇佣顶级架构师?MiniMax M2.5要把Agent价格打穿 那个霸榜的Pony Alpha现身了:智谱GLM-5硬刚Claude Opus 纯国产算力硬刚GPT?聊聊刚发布的讯飞星火X2 阿里Qwen-Image-2.0实测:终于有一款能听懂人话、写对汉字的AI了 别再等Sora了,字节Seedance 2.0才是AI视频的“导演时刻” Mistral 掀桌子:40亿参数跑本地,Voxtral 2 把延迟压进了200毫秒
腾讯CodeBuddy 2.0:从“副驾驶”到“全栈合伙人”的进化参数仅100亿却硬刚千亿巨头:阶跃星辰Step3-VL-10B凭什么封神?告别修图软件的图层噩梦,腾讯混元3.0让AI学会了“思考”Kimi K2.5开源:自带百人众包团队,月之暗面重新定义生产力告别AI塑料感?通义Z-Image开源:6B参数要把“大众脸”送进历史堆视频生成圈炸了:SkyReels-V3开源,三大功能硬刚商业模型
优化Shadowsocks-libev服务器以获得更好的表现 开放至极致:OLMo 3如何重塑开源大模型游戏规则? Kimi Linear:告别O(N²)!AI长文本的新一代“记忆大师” Google Cloud Bigtable 分布式的NoSQL数据库 双面魔术师:Wan2.2-Animate,让视频焕发生机 OpenAI王炸!o3价格“大跳水”,开发者狂喜!
标签聚合
开源 算法 spring 设计模式 大模型 java AI 教程

COPYRIGHT © 2023 墨风如雪博客. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang