墨风如雪博客

  • 源码小店
  • 导航站
  • 登录
  • java
  • 资源分享
让AI使用变得如此简单
  1. 首页
  2. AI
  3. 正文

华为亮出王牌:70亿参数“特种兵”与720亿“航母”级模型同时开源

2025年 6月 30日 6点热度 0人点赞 0条评论

2025年6月30日,华为在人工智能领域投下了一枚重磅炸弹,正式宣布首次大规模开源其核心底牌——盘古大模型系列。这并非一次简单的模型分享,而是一套包含了两款重磅模型及全套昇腾硬件推理技术的“组合拳”,旨在为全球开发者构建一个从芯片到应用的完整AI生态。

“航母级”选手:盘古 Pro MoE 72B

首先登场的是“航母级”选手——拥有720亿总参数的盘古 Pro MoE 模型。它没有简单地堆砌参数,而是独创了MoGE(分组混合专家)架构。

你可以把它想象成一个拥有众多顶尖专家的智囊团。传统方式是任务来了大家一起上,容易造成忙的忙死、闲的闲死。而MoGE则聪明地将专家们分成了不同的小组,任务来了先分配到小组,再由小组内的专家协同解决,确保了计算资源的负载均衡。

这种设计的巧妙之处在于,每次处理任务时,仅需激活约160亿参数,却能爆发出远超同级模型的能量。在华为自家的昇腾800I A2芯片上,它的推理速度飙到惊人的1148 tokens/s,通过技术加速更能冲到1528 tokens/s,真正实现了“以小博大”的超高效率。目前,这款模型的权重和配套的推理代码已在GitCode平台开放。

GuqMQpiWcAADw_5

灵活的“特种兵”:盘古 7B

如果说72B模型是重装旗舰,那么70亿参数的盘古7B模型就是一名灵活善战的“特种兵”。它最大的亮点是具备“快思考”与“慢思考”双系统框架。

  • 快思考:处理日常、简单的任务,追求极致的响应速度。
  • 慢思考:当遇到复杂的推理难题时,它会自动切换到该模式,进行深度分析,确保结果的准确性。

这种自适应能力让它在AIME、GPQA等高难度推理测试中,表现超越了Qwen3-8B等同规模的对手。更重要的是,它对边缘设备极为友好,非常适合部署在算力有限的终端上,让AI能力深入到工厂、汽车、医疗设备等各个角落。这款模型也即将开放下载。

iShot_2025-06-30_21.48.58

真正的底牌:软硬协同的昇腾生态

这次开源的核心,远不止模型本身。华为同步开放了基于昇腾(Ascend)硬件的全套大规模模型推理技术。

这套工具链包含了从底层通信优化(FlashComm)、量化压缩(OptiQuant)到负载均衡算法(OmniPlacement)等一系列“独门秘籍”。正是这些技术,才将盘古模型的潜力在昇腾芯片上压榨到了极致。

Guqpr_JW8AASg7E

华为此举意图明确:通过开放最高性能的模型和最高效的工具,吸引全球开发者在昇腾硬件上进行创新。这不仅是技术自信的体现,更是构建国产AI全栈体系、从“算力追随者”向“架构定义者”转变的关键一步。

总而言之,华为这次开源,为开发者同时送上了“顶级跑车”(盘古模型)和“无限油料的高速公路”(昇腾生态),无疑将极大降低AI应用的门槛,加速整个行业的创新浪潮。


如果你也对最新的AI信息感兴趣或者有疑问 都可以加入我的大家庭 第一时间分享最新AI资讯、工具、教程、文档 欢迎你的加入!!!😉😉😉

公众号:墨风如雪小站

wx
  • 我的博客:https://blog.worldcodeing.com/
  • 我的导航站:https://nav.worldcodeing.com/
  • 源码小站:https://www.worldcodeing.com/
本作品采用 知识共享署名 4.0 国际许可协议 进行许可
标签: 华为 昆仑 盘古
最后更新:2025年 6月 30日

墨风如雪

一个热爱生活,热爱分享的程序员

打赏 点赞
< 上一篇

文章评论

您需要 登录 之后才可以评论

墨风如雪

一个热爱生活,热爱分享的程序员

最新 热点 随机
最新 热点 随机
华为亮出王牌:70亿参数“特种兵”与720亿“航母”级模型同时开源 一张3090就能跑!腾讯混元A13B,这是给AI圈的降维打击? 告别抓耳挠腮!Gemini CLI,让你和你的终端聊上了天 AI圈大地震!120亿参数的FLUX编辑器开源,你的显卡准备好了吗? 智能触手可及:Google Gemma-3n 系列模型,让万物皆能“思考” 2000万次呼唤背后,蓝骑士有了“赛博外挂”
Kimi-Dev-72B:月之暗面如何用720亿参数“驯服”代码世界?国产视频AI卷出新高度!海螺02不止能跳舞,还懂物理腾讯云掀桌子了!这个免费CDN,国内秒开还无限流量?别只盯着Suno了,腾讯端出的这盘“王炸”可能要改变游戏规则Kimi变身学术“卷王”,你的论文和报告还好吗?昆仑万维扔出王炸:32B模型干翻671B,代码界迎来全能修理工!
优化Shadowsocks-libev服务器以获得更好的表现 8亿参数撬动实时混音!谷歌开源“口袋DJ”,人人都能玩转音乐 网络传输当中 五种IO模型详解 DeepSeek-R1T-Chimera:当R1的智慧,遇上V3的速度!开源AI新物种驾到! 你应该尝试使用 ChatGPT 进行开发的 10 个最佳实践 风暴眼中的新王:阿里通义千问 Qwen2 登顶开源竞技场,Qwen2.5-Omni 或将掀起新浪潮?
标签聚合
算法 AI deepseek 教程 spring 设计模式 java 动态规划

COPYRIGHT © 2023 墨风如雪博客. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

免责声明 - 隐私政策