墨风如雪博客

  • 源码小店
  • 传家宝VPS
让AI使用变得如此简单
  1. 首页
  2. AI
  3. 正文

今夜,智谱把“手机贾维斯”的源代码,扔到了GitHub上

2025年 12月 9日 43点热度 0人点赞 0条评论

2025年12月9日,科技圈发生了一件可能会被载入AI发展史的大事。

当大部分人还在讨论哪家的大模型写诗更押韵时,智谱AI默默干了一件事:他们把自家的核心AI Agent模型——AutoGLM,正式开源了。

这不仅仅是开源了一个模型,更像是把一把通往“真·智能手机”时代的钥匙,交到了每一个开发者,甚至是普通玩家手里。

asdasf

真的能看懂屏幕的AI

先别急着划走,我们得搞清楚AutoGLM和Siri、小爱同学到底有什么区别。

传统的语音助手,本质上是在调用APP提供的接口。如果APP不开接口,助手就是个瞎子。但AutoGLM走的是一条完全拟人的路子:视觉理解。

简单说,它像人眼一样“看”你的手机屏幕截图,用大模型分析界面上的按钮、文字、输入框在哪里,然后通过ADB指令模拟手指的点击和滑动。

这意味着什么?意味着它不需要微信给你开API,也能帮你回消息;不需要美团授权,也能帮你点外卖。

在智谱放出的演示里,这个9B参数量的模型(AutoGLM-Phone-9B),已经能熟练地在微信、淘宝、抖音、美团等50多个我们每天都在用的APP里“冲浪”。点外卖、订机票、发红包,这些需要跨应用、甚至长达几十步的操作,它都能自己搞定。

v2-e6b5d85ff6306e3bd6990d1cca6ec2aa_r

为什么说这是“掀桌子”?

在前段时间,字节跳动的“豆包手机助手”刚让大家见识了AI操作手机的威力。就在各大巨头准备筑起高墙、圈地自萌的时候,智谱反手就是一个开源。

这一招,直接把技术门槛拉到了地板上。

1. 每个人都能有自己的定制管家 开源意味着硬件厂商不用从头造轮子,华强北的开发者、甚至是你我这样懂点代码的极客,都可以基于AutoGLM,为自己的设备装上一个“大脑”。想做一个专门帮你抢演唱会门票的Agent?或者一个只在这个点帮你自动领游戏签到奖励的脚本?现在,底座有了。

2. 隐私狂魔的福音 这是开源最核心的杀手锏。很多人不敢用云端AI操作手机,怕隐私泄露。AutoGLM支持本地部署。只要你的设备跑得动,所有的数据处理、屏幕识别、操作指令,全部都在你本地完成,不需要上传任何一字节的敏感信息给云端服务器。你的手机,完全由你掌控。

iShot_2025-12-09_22.55.13

32个月的磨剑

这个项目不是一时兴起。据透露,智谱团队从2023年4月就开始折腾这事儿了。

早期的版本很不稳定,像个刚学步的孩子,经常点错或者卡住。经过32个月的打磨,特别是AutoGLM 2.0版本,在数千个虚拟设备里进行了强化学习,现在的它已经具备了相当强悍的泛化能力。也就是说,哪怕APP更新了,界面微调了,它依然能认出“确认支付”的按钮在哪。

下一代手机的雏形

我们总在喊“AI手机”元年,但如果AI手机只是多了一个画图功能,那未免太无聊了。

真正的AI手机,应该是你对它说“帮我订张明天去上海的票,要靠窗”,然后你就可以把手机扔一边去洗澡,出来时票已经出好了。AutoGLM的开源,正在把这个场景变成所有安卓设备的标配,而不再是某一款旗舰机的专属。

目前,项目代码已经托管在GitHub,模型权重也上了Hugging Face。虽然现在它可能还不够完美,偶尔也会犯傻,但开源社区的力量是恐怖的。也许下周,就会有大神魔改出更惊艳的版本。

对于开发者来说,这是风口;对于普通用户来说,那个像《钢铁侠》里贾维斯一样的管家,可能真的不远了。

iShot_2025-12-09_22.55.08

最后提个醒: 虽然代码开源了,但在让AI帮你花钱或者发消息之前,记得把那个“关键操作需人工确认”的开关打开。毕竟,你也不想一觉醒来,发现AI帮你清空了购物车,对吧?


如果你也对最新的AI信息感兴趣或者有疑问 都可以加入我的大家庭 第一时间分享最新AI资讯、工具、教程、文档 欢迎你的加入!!!😉😉😉

公众号:墨风如雪小站

  • 我的博客:https://blog.worldcodeing.com/
  • 传家宝VPS:https://www.legacyvps.com/
  • 源码小站:https://www.worldcodeing.com/
本作品采用 知识共享署名 4.0 国际许可协议 进行许可
标签: AutoGLM 智谱
最后更新:2025年 12月 9日

墨风如雪

一个热爱生活,热爱分享的程序员

打赏 点赞
< 上一篇
下一篇 >

墨风如雪

一个热爱生活,热爱分享的程序员

最新 热点 随机
最新 热点 随机
GPT-5.2深夜炸场:为了让你每周少干10小时,OpenAI拼了 告别机械音!VoxCPM 1.5开源,这才是我们要的“最强嘴替” Mistral 掀桌了:Devstral 2 与 Vibe CLI 重塑开源编程体验 今夜,智谱把“手机贾维斯”的源代码,扔到了GitHub上 智谱GLM-4.6V开源:不仅仅是“看懂”,它终于长出了“双手” 谷歌深夜炸场:月费250刀的Deep Think,这次真的学会了“慢思考”
国产AI代码逆袭:GLM-4.6凭什么并列全球第一?文心5.0:2.4万亿参数的“全能AI”,它真做到了吗?字节TRAE SOLO:你的AI编程副驾已上线!阿里AI的“船票之战”:千问APP剑指C端,能否重塑格局?Grok 4.1:马斯克AI的里程碑式飞跃,它到底有多强?谷歌Gemini 3:当AI开始“自己动手”,我们离未来更近一步
java 持久层框架Hibernate的(超详细总结) 开拍!谷歌 Veo 2 正式登陆 Gemini API - 你的视频工作流,准备好被颠覆了吗? DeepWiki 开源版本:AI 帮你自动写代码 Wiki,告别手动苦海! Grok 4.1:马斯克AI的里程碑式飞跃,它到底有多强? 告别“打工人”模式,AI“全能选手”RoboNeo 来了! 拆解Seed-OSS-36B:不只是参数怪兽,更是优雅的控制大师
标签聚合
教程 大模型 java 算法 设计模式 AI deepseek spring

COPYRIGHT © 2023 墨风如雪博客. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang