快手可灵2.0炸场：告别面瘫机器人，你的JPG照片现在能拿奥斯卡了

说实话，在此之前，我对所谓的“数字人”一直是持保留态度的。你肯定也见过那种视频：一张僵硬的脸，嘴巴机械地一张一合，眼神空洞得像是在念稿子。那种东西，与其叫“数字人”，不如叫“对口型机器”。但在2025年12月4日，快手可灵AI把这个定义彻底改写了。可灵数字人2.0正式全量上线。这次更新最让我感到兴奋的，不是什么复杂的参数堆砌，而是一个非常感性的变化：它终于从“会说话”，进化到了“会表演”。给AI装上“导演思维” 以前的数字人技术，很多时候是听不懂人话的。你给它一段悲伤的音频，它可能还是瞪着大眼睛在那儿念词。 …

2025年 12月 6日 0条评论 203点热度 0人点赞墨风如雪阅读全文

就在大家都盯着谷歌和 OpenAI 神仙打架的时候，视频生成赛道的老玩家 Runway 居然悄无声息地扔出了一颗深水炸弹。 2025 年 12 月 1 日，Runway 正式发布了新一代模型 Gen-4.5。如果你关注过他们内部的动向，可能听说过这个代号——“David”（大卫）。这可不是随便起的名，它是《圣经》里“大卫战胜巨人歌利亚”的那个大卫。 Runway 的意思很直白：虽然我们就一百来号人，比起谷歌和 OpenAI 这种科技巨头算是绝对的“弱势群体”，但这回，我们要赢。事实证明，他们好像真的做到了。凭什…

2025年 12月 2日 0条评论 254点热度 0人点赞墨风如雪阅读全文

作为一名每天都在和各种AI模型“斗智斗勇”的内容创作者，我不得不承认，视频生成这块骨头一直是最难啃的。我们要么在不同工具间反复横跳，要么对着生成的视频里乱飞的五官叹气。但最近，快手旗下的可灵AI发布了全新的“可灵O1”模型，并且已经在LiblibAI上线。上手体验了一番后，我那种“终于等到你”的感觉非常强烈。它不是简单的画质升级，而是改变了玩视频的逻辑。为什么叫O1？不仅仅是名字好听 O1代表的是Omni，也就是“全能”。以前我们做AI视频是怎样的？先用Midjourney出图，再用Runway或者Luma让…

2025年 12月 2日 0条评论 209点热度 0人点赞墨风如雪阅读全文

各位AI领域的同仁们，以及所有内容创作者们，一个足以改变游戏规则的重磅消息不容错过！就在2025年10月24日，火山引擎正式将豆包视频生成模型1.0 Pro Fast推向了市场。这不是简单的版本迭代，而是对现有视频创作工作流的一次深度革新，其核心理念无非八个字：更快、更省、更好用。作为一名长期关注AI创作前沿的观察者，我不得不说，这次发布给我的冲击力是巨大的。它像一把锋利的凿子，精准地击中了当前视频内容生产的两大痛点——时间和成本。颠覆性提升：速度与价格的双重震撼我们先从最直观的数字聊起。想象一下，你脑海中…

2025年 10月 27日 0条评论 273点热度 0人点赞墨风如雪阅读全文

最近，AI视频圈又炸锅了！谷歌近期重磅发布了其视频生成模型Veo的升级版本——Veo 3.1。这次更新，绝不仅仅是简单的数字迭代，它标志着AI视频创作领域的一个里程碑：我们不再仅仅停留在“像素的真实”，而是全面进军“感官的沉浸”。对于我这样长期关注AI创作的“老兵”来说，Veo 3.1无疑是谷歌献给所有创作者的一份大礼，它让AI讲故事的能力，真正迈向了“电影级”的殿堂。音画同步，告别“哑剧”时代要说Veo 3.1最让我眼前一亮的，无疑是它那原生音频合成的能力。以往的AI视频，无论画面多么逼真、多么震撼，总感觉缺…

2025年 10月 16日 0条评论 213点热度 0人点赞墨风如雪阅读全文

嘿，朋友们！想象一下，你不再只是被动地观看屏幕上生成的虚拟世界，而是能够亲自“走进”其中，沿着自己设定的轨迹，自由漫游，而且这个世界还拥有真实的三维深度和结构。听起来是不是有点科幻？但腾讯混元团队似乎正把这份科幻照进现实，预备在明年为我们带来HunyuanWorld-Voyager——一个号称“业界首个支持原生3D重建的超长漫游世界模型”。 🗺️ 拓疆者登场：Voyager的野心这款模型的出现，可不是为了简单地生成一段酷炫的视频，它的核心目标是拓展AI在空间智能的边界。设想一下，你只需提供一张图片，Voyager…

2025年 9月 2日 0条评论 284点热度 0人点赞墨风如雪阅读全文

如果你以为AI语音合成已经够惊艳了，那微软这次自研的MAI-Voice-1，恐怕要刷新你的认知天花板。这不是简单的技术升级，更像是给整个语音AI领域投下了一枚重磅炸弹，预示着一个高效、情感丰富、且成本更低的全新时代即将到来。作为一名长期关注AI圈的创作者，我不得不说，微软这次玩儿大了。告别等待：单GPU，秒级生成一分钟音频！这无疑是MAI-Voice-1最核心也最令人瞠目的亮点。想象一下，你只需要一块普通的GPU（比如我们熟悉的英伟达H100），在不到一秒钟的时间里，就能生成一段长达一分钟、高保真的语音内容。这…

2025年 9月 1日 0条评论 258点热度 0人点赞墨风如雪阅读全文

还记得那些让人惊叹的AI生成视频吗？它们画面精美、创意无限，却常常带着一丝遗憾——有画无声，或是配乐生硬。这就像看一部默片，总觉得少了点灵魂。如今，腾讯混元团队给出了答案，他们开源的端到端视频音效生成模型 HunyuanVideo-Foley，正在悄然改变这一切，让AI视频真正拥有了“电影级的耳朵”。作为一名AI圈的观察者，我一直期待能有一种技术，彻底解决AI内容“视听分离”的痛点。HunyuanVideo-Foley的出现，无疑是这个领域的一个里程碑。一、告别“默片时代”：HunyuanVideo-Foley…

2025年 8月 28日 0条评论 295点热度 0人点赞墨风如雪阅读全文

一、模型简介阿里云万相2.1（Wan 2.1）是通义万相系列的最新多模态视频生成大模型，于2025年1月发布，同年2月25日全面开源。该模型支持文生视频（T2V）和图生视频（I2V），并首次实现中文与英文文本效果动态融合，适用于广告、教育、影视等多领域。核心亮点多模态能力：支持文本/图像输入生成480P及以上分辨率视频，且可生成动态字幕或特效。创新架构：采用超长上下文训练和参数共享机制，降低训练成本。开源免费：提供两种参数版本（14B、1.3B）的完整代码与权重。高性能表现：在Vbench评测中以86…

2025年 3月 4日 0条评论 613点热度 0人点赞墨风如雪阅读全文

快手可灵2.0炸场：告别面瘫机器人，你的JPG照片现在能拿奥斯卡了

硅谷巨头被一家百人小厂“偷家”了：详解 Runway Gen-4.5

像P图一样改视频？可灵O1来了，视频生成领域的“瑞士军刀”

豆包视频Pro Fast：AI视频创作，效率成本双降维打击！

告别无声AI视频！谷歌Veo 3.1打造沉浸式视听盛宴

2025，AI世界模型新篇章：腾讯混元Voyager展望

单GPU秒产一分钟！MAI-Voice-1，微软语音AI的“核爆”时刻？

让AI视频开口说话：腾讯混元Foley模型重塑视听体验

阿里云万相2.1：开源视频生成模型的全面解析