墨风如雪博客

  • 源码小店
  • 导航站
  • 登录
  • java
  • 资源分享
让AI使用变得如此简单
  1. 首页
  2. AI
  3. 正文

智谱AI掀桌子了:那个会“思考”的视觉模型,9B参数硬刚72B巨兽

2025年 7月 2日 10点热度 0人点赞 0条评论

朋友们,AI圈又地震了!

就在我们还在讨论哪个模型能多看几页PDF、多认几张图的时候,智谱AI(Zhipu AI)直接甩出王炸——GLM-4.1V-Thinking。注意这个后缀,“Thinking”,品出点不一样的味道了吗?

没错,这货不再满足于“看见”,它要的是“思考”。

iShot_2025-07-02_22.16.39

不止“看见”,更在“思考”

我们见惯了会“看”的AI,给它一张图,它告诉你“这是一只猫”。但如果你问它:“这只猫为什么看起来很警惕?它下一步可能要去哪?”大部分模型就得开始“自由发挥”了。

GLM-4.1V-Thinking要解决的就是这个。它内置了一套骚操作——“思维链”(Chain-of-Thought)推理机制。简单来说,它在处理复杂视觉问题时,会像一个学霸解题一样,在脑子里一步步分析、推导,而不是直接蹦出个答案。

比如,看到一张复杂的物理实验图,它会先识别器材,再分析连接方式,推导物理原理,最后预测实验结果。每一步都有迹可循,这让它的回答不仅更准,而且逻辑清晰,有种“智商在线”的踏实感。

641 (1)

拳怕少壮:9B 对决 72B 的惊人战绩

光说不练假把式。最让我热血沸腾的,是它的性能数据。

智谱这次开源的GLM-4.1V-9B-Thinking,参数量只有9B。在如今这个动辄千亿参数的“军备竞赛”时代,这算是个轻量级选手。但就是这个“小家伙”,在28项权威的多模态评测中,有18项的成绩持平甚至超越了72B参数的Qwen-2.5-VL!

这什么概念?这简直是AI界的“轻量级拳王”跨级别挑战,还把重量级选手打得有来有回。它用硬核实力告诉我们:参数大小不是唯一的神,聪明的“大脑结构”才是王道。

641

你的下一台“视觉大脑”,能做什么?

说了这么多,这东西到底能干嘛?应用场景简直不要太酷:

  • 超级学霸:把高考数学的几何题、物理的电路图扔给它,它能像老师一样,一步步写出推导过程帮你解题。
  • 数字劳工:看一眼复杂的软件界面(GUI),就能化身Agent帮你自动操作,比如预定会议、填写表单,比实习生还靠谱。
  • 代码神笔:对着一张UI设计稿,它能直接为你“码”出前端代码。产品经理的梦中情“模”了属于是。
  • 视频侦探:长达两小时的视频,它能帮你快速梳理人物关系、分析剧情走向,以后追剧、看监控都省心了。

最关键的是,这一切的背后,是超长的64K上下文和对4K高清图像的支持。这意味着无论你的“投喂”的材料多复杂、多高清,它都能从容应对。

AA1HOqtw

开源!免费商用!你的3090已经饥渴难耐

最后,也是最重要的一点:智谱把这套模型给开源了!

  • 完全开源:模型权重、代码、工具全部开放。
  • 免费商用:采用MIT协议,你可以用它来开发自己的商业产品,不用担心授权问题。
  • 硬件友好:官方提到,单张3090显卡就能跑起来!这大大降低了我们普通开发者和中小团队的尝鲜门槛。

这已经不是“交个朋友”,这简直是把压箱底的宝贝拿出来,邀请整个社区一起“搞事情”。


总而言之,GLM-4.1V-Thinking的发布,就像在多模态领域投下了一颗深水炸弹。它不仅秀出了惊人的技术实力,更用开源和生态扶持的姿态,向所有开发者发出了“黄金时代,即刻启程”的邀请函。

好了,不说了,我得赶紧去GitHub上把玩一下这个“会思考的眼睛”了。兄弟们,冲!

iShot_2025-07-02_22.17.10

传送门在这,不用谢:

  • Hugging Face: THUDM/GLM-4.1V-9B-Thinking
  • GitHub: https://github.com/THUDM/GLM-4.1V-Thinking

如果你也对最新的AI信息感兴趣或者有疑问 都可以加入我的大家庭 第一时间分享最新AI资讯、工具、教程、文档 欢迎你的加入!!!😉😉😉

公众号:墨风如雪小站

wx
  • 我的博客:https://blog.worldcodeing.com/
  • 我的导航站:https://nav.worldcodeing.com/
  • 源码小站:https://www.worldcodeing.com/
本作品采用 知识共享署名 4.0 国际许可协议 进行许可
标签: GLM-4.1V-Thinking 智谱 视觉模型
最后更新:2025年 7月 2日

墨风如雪

一个热爱生活,热爱分享的程序员

打赏 点赞
< 上一篇
下一篇 >

文章评论

您需要 登录 之后才可以评论

墨风如雪

一个热爱生活,热爱分享的程序员

最新 热点 随机
最新 热点 随机
AI界又炸了!会“卡壳”、会“改作业”的Dhanishtha-2.0来了! 智谱AI掀桌子了:那个会“思考”的视觉模型,9B参数硬刚72B巨兽 AI开口“飚”方言!阿里Qwen-TTS发布,从京腔到川普,7种宝藏音色任你选 华为亮出王牌:70亿参数“特种兵”与720亿“航母”级模型同时开源 一张3090就能跑!腾讯混元A13B,这是给AI圈的降维打击? 告别抓耳挠腮!Gemini CLI,让你和你的终端聊上了天
Kimi-Dev-72B:月之暗面如何用720亿参数“驯服”代码世界?国产视频AI卷出新高度!海螺02不止能跳舞,还懂物理腾讯云掀桌子了!这个免费CDN,国内秒开还无限流量?别只盯着Suno了,腾讯端出的这盘“王炸”可能要改变游戏规则Kimi变身学术“卷王”,你的论文和报告还好吗?昆仑万维扔出王炸:32B模型干翻671B,代码界迎来全能修理工!
SpringBoot四大核心组件详解 别只盯着Suno了,腾讯端出的这盘“王炸”可能要改变游戏规则 告别机械感!OpenAudio S1让AI声音活起来 Spring DI:依赖注入的完整指南 设计模式:工厂设计模式 使用宝塔面板搭建个人网站的详细步骤
标签聚合
动态规划 算法 deepseek AI spring 教程 java 设计模式

COPYRIGHT © 2023 墨风如雪博客. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

免责声明 - 隐私政策