墨风如雪博客

  • 源码小店
  • 传家宝VPS
MiniMax
AI

别再死磕扩散模型了,MiniMax新开源揭示:视觉Tokenizer才是下一个金矿

在AI绘画和视频生成卷到飞起的今天,不管是大厂还是开源社区,大家似乎都陷入了一个怪圈:拼命堆算力去训练更大的Diffusion Transformer(DiT),指望通过增加生成模型的参数来获得更好的画质。 但就在前两天,凭借海螺视频(Hailuo AI)在圈内名声大噪的MiniMax团队,突然开源了一个名为VTP(Visual Tokenizer Pre-training)的项目。看完他们的论文和代码,我不得不说,这帮人可能刚刚掀翻了视觉生成领域的桌子。 他们抛出了一个极其反直觉的结论:如果我们一直在错误的地方用…

2025年 12月 21日 0条评论 240点热度 0人点赞 墨风如雪 阅读全文
AI

AI语音圈炸锅了!MiniMax Speech-02凭啥超越ElevenLabs和OpenAI,双榜登顶?

嘿,各位AI弄潮儿们!最近AI圈最让我肾上腺素飙升的消息是啥?不是哪个大模型又发了新论文,也不是哪个应用又多了个炫酷功能。是国产AI在语音合成领域,实打实地把国际巨头挑下马了! 没错,说的就是MiniMax最新推出的 Speech-02 系列语音模型。这家伙,一出手就在两个业界最权威的语音评测榜单上双双登顶,把之前风头无两的 ElevenLabs 和 OpenAI 最新的 TTS 模型都甩在了身后!这感觉,就像国货跑车在F1赛道上拿了冠军,太提气了! 权威榜单硬实力,全球第一不是吹的! 不是吹牛,是实打实的战绩!两…

2025年 5月 17日 0条评论 520点热度 0人点赞 墨风如雪 阅读全文

墨风如雪

一个热爱生活,热爱分享的程序员

最新 热点 随机
最新 热点 随机
1美元雇佣顶级架构师?MiniMax M2.5要把Agent价格打穿 那个霸榜的Pony Alpha现身了:智谱GLM-5硬刚Claude Opus 纯国产算力硬刚GPT?聊聊刚发布的讯飞星火X2 阿里Qwen-Image-2.0实测:终于有一款能听懂人话、写对汉字的AI了 别再等Sora了,字节Seedance 2.0才是AI视频的“导演时刻” Mistral 掀桌子:40亿参数跑本地,Voxtral 2 把延迟压进了200毫秒
具身智能的里程碑:Figure 03 解读 OpenAI Aardvark:当AI化身代码守护者 Python知识点:生成器在 Python 中的应用 JAVA当中常用的锁 分析和讲解 腾讯CodeBuddy:AI编程全景,解锁效率新维度 免费+性能双杀!百度文心大模型4.5/X1提前上线,开启AI普惠新时代
标签聚合
大模型 java AI 算法 设计模式 教程 开源 spring

COPYRIGHT © 2023 墨风如雪博客. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang