墨风如雪博客

  • 源码小店
  • 传家宝VPS
阿里云
AI

告别鸡同鸭讲,钉钉Fun-ASR让AI听懂行业“黑话”

你是否经历过这样的会议:激情澎湃地讨论着“Sonocore发泡工艺”和“Pulse脉冲乳胶”,会议纪要却给你转写成了“声呐阔尔”和“派斯乳胶”?这种“AI在听,但没听懂”的尴尬,正在被终结。 2025年8月22日,钉钉与通义实验室语音团队联手,向企业界投下了一枚重磅炸弹——Fun-ASR语音识别大模型。这不又是一个普通的语音转文字工具,而是一个真正能深入业务场景,听懂行业“黑话”的智能伙伴。 不止于听见,更在于听懂 传统的语音识别模型,在日常对话中表现尚可,可一旦进入专业领域,便常常“水土不服”。而Fun-ASR的…

2025年 8月 22日 0条评论 83点热度 0人点赞 墨风如雪 阅读全文
AI

别再卷万亿参数了,这个4B模型正把AI工作站塞进你的手机

当所有人的目光都还聚焦在“谁家模型参数更多、体量更大”的军备竞赛时,阿里通义千问团队却悄悄换了个赛道,扔出了一颗重磅炸弹:Qwen3-4B-2507系列。 你没看错,参数只有4B。在动辄千亿万亿的时代,这听起来像个“弟弟”。但请收起你的轻视,因为这个小家伙,正在用一种近乎蛮横的方式,重新定义我们对“性能”与“尺寸”的认知。 这不是升级,是“降维打击” 我们先不谈那些复杂的术语,直接上战绩。 过去,小模型总被认为是“智商阉割版”,能聊天就不错了。但这次的Qwen3-4B,尤其是它的“思考增强版”(Thinking-2…

2025年 8月 9日 0条评论 103点热度 0人点赞 墨风如雪 阅读全文
AI

你的桌面,就是好莱坞:阿里万相2.2如何掀起视频创作革命

在AI生成内容的浪潮之巅,视频领域始终是那块最难啃的硬骨头。当许多人还在为生成画面的稳定性和真实感苦恼时,阿里通义万相Wan2.2携着一身“黑科技”悄然登场,它所做的不仅仅是迭代,更像是一场对视频创作门槛的颠覆性革命。 两位“专家”,一位导演——聊聊它的智慧核心 想象一下,拍摄一部电影,你需要一位总揽全局的导演,负责构图和故事节奏;还需要一位精益求精的摄影师,负责光影和细节质感。Wan2.2的“混合专家(MoE)”架构,正是这样做的。 这是业界首次将MoE引入视频模型。它巧妙地将模型分为“高噪声专家”和“低噪声专家…

2025年 7月 29日 0条评论 150点热度 0人点赞 墨风如雪 阅读全文
AI

告别码农式炼丹!阿里云百炼这波MCP服务,让AI Agent开发像搭积木一样简单?

嘿,各位AI圈的朋友们,最近是不是感觉大模型、Agent这些概念满天飞,但真要自己动手搞一个,要么得是代码大神,要么就得烧不少资源?别急,最近我发现阿里云百炼平台推出了一个叫"全生命周期MCP服务"的东西,感觉有点意思,今天就来跟大家扒一扒,看看它是不是真能让咱们普通开发者也能轻松玩转AI Agent。 先说说,这MCP是个啥玩意儿? MCP,全称是 Model Context Protocol,听起来挺唬人,但说白了,它是由Anthropic(就是搞Claude的那家公司)提出的一个开放协议。它的目标很简单,就是…

2025年 4月 9日 0条评论 227点热度 0人点赞 墨风如雪 阅读全文
AI

颠覆传统!QVQ-Max:开启AI‘视觉思考’新纪元

引言:视觉推理的新篇章 在人工智能的浪潮中,视觉推理(Visual Reasoning)正逐渐成为 AI 从“感知”迈向“认知”的关键桥梁。想象一下,一个 AI 不仅能“看懂”图片,还能像人类一样“思考”其中的逻辑和深意——这正是阿里通义团队最新推出的 QVQ-Max 模型所追求的目标。作为一款前沿的视觉推理模型,QVQ-Max 不仅在视觉解析上拥有“火眼金睛”,更在推理能力上展现出“脑洞大开”的潜力。本文将带你深入剖析 QVQ-Max 的技术内核、核心能力、应用场景以及未来前景,一起探索 AI 科技的下一站! Q…

2025年 3月 28日 0条评论 233点热度 0人点赞 墨风如雪 阅读全文
AI

阿里云万相2.1:开源视频生成模型的全面解析

一、模型简介 阿里云万相2.1(Wan 2.1) 是通义万相系列的最新多模态视频生成大模型,于2025年1月发布,同年2月25日全面开源。该模型支持文生视频(T2V)和图生视频(I2V),并首次实现中文与英文文本效果动态融合,适用于广告、教育、影视等多领域。 核心亮点 多模态能力:支持文本/图像输入生成480P及以上分辨率视频,且可生成动态字幕或特效。 创新架构:采用超长上下文训练和参数共享机制,降低训练成本。 开源免费:提供两种参数版本(14B、1.3B)的完整代码与权重。 高性能表现:在Vbench评测中以86…

2025年 3月 4日 0条评论 233点热度 0人点赞 墨风如雪 阅读全文

墨风如雪

一个热爱生活,热爱分享的程序员

最新 热点 随机
最新 热点 随机
腾讯混元MT-7B:打破参数迷思,重塑机器翻译版图 瑞士AI宣言:Apertus如何定义开放大模型 月之暗面Kimi K2-0905:代码与创意的新篇章? 谷歌“蕉”傲登场!AI生图告别“走钟”时代 2025,AI世界模型新篇章:腾讯混元Voyager展望 单GPU秒产一分钟!MAI-Voice-1,微软语音AI的“核爆”时刻?
别再卷万亿参数了,这个4B模型正把AI工作站塞进你的手机全球最佳开放模型!OpenAI开源GPT-OSS,AI界迎来巨变!声音即影像:昆仑万维SkyReels-A3如何叩响内容创作的革命前夜9B参数硬撼72B,GLM-4.1V凭什么搅动AI江湖?2B参数掀翻巨头牌桌:昆仑万维UniPic 2.0的“四两拨千斤”天工V2发布:AI终于撕掉了“纯文本”的标签
iOS快捷指令×DeepSeek:三步打造智能自动化工作流 Dify平台:企业级AI开发的快速部署与自定义指南 阿里亮剑Ovis2.5:90亿参数挑战巨兽,AI视觉从此不“近视” OWL Agent 实战指南:零成本打造你的全能开源 AI 打工人 不再是指令的奴隶:智元Genie,让机器人拥有了想象力 Mac本地部署DeepSeek蒸馏模型指南:Ollama极简手册
标签聚合
设计模式 大模型 java 教程 spring 算法 deepseek AI

COPYRIGHT © 2023 墨风如雪博客. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang