墨风如雪博客

  • 源码小店
  • 传家宝VPS
MiniMax
AI

别再死磕扩散模型了,MiniMax新开源揭示:视觉Tokenizer才是下一个金矿

在AI绘画和视频生成卷到飞起的今天,不管是大厂还是开源社区,大家似乎都陷入了一个怪圈:拼命堆算力去训练更大的Diffusion Transformer(DiT),指望通过增加生成模型的参数来获得更好的画质。 但就在前两天,凭借海螺视频(Hailuo AI)在圈内名声大噪的MiniMax团队,突然开源了一个名为VTP(Visual Tokenizer Pre-training)的项目。看完他们的论文和代码,我不得不说,这帮人可能刚刚掀翻了视觉生成领域的桌子。 他们抛出了一个极其反直觉的结论:如果我们一直在错误的地方用…

2025年 12月 21日 0条评论 334点热度 0人点赞 墨风如雪 阅读全文
AI

AI语音圈炸锅了!MiniMax Speech-02凭啥超越ElevenLabs和OpenAI,双榜登顶?

嘿,各位AI弄潮儿们!最近AI圈最让我肾上腺素飙升的消息是啥?不是哪个大模型又发了新论文,也不是哪个应用又多了个炫酷功能。是国产AI在语音合成领域,实打实地把国际巨头挑下马了! 没错,说的就是MiniMax最新推出的 Speech-02 系列语音模型。这家伙,一出手就在两个业界最权威的语音评测榜单上双双登顶,把之前风头无两的 ElevenLabs 和 OpenAI 最新的 TTS 模型都甩在了身后!这感觉,就像国货跑车在F1赛道上拿了冠军,太提气了! 权威榜单硬实力,全球第一不是吹的! 不是吹牛,是实打实的战绩!两…

2025年 5月 17日 0条评论 599点热度 0人点赞 墨风如雪 阅读全文

墨风如雪

一个热爱生活,热爱分享的程序员

最新 热点 随机
最新 热点 随机
1美元雇佣顶级架构师?MiniMax M2.5要把Agent价格打穿 那个霸榜的Pony Alpha现身了:智谱GLM-5硬刚Claude Opus 纯国产算力硬刚GPT?聊聊刚发布的讯飞星火X2 阿里Qwen-Image-2.0实测:终于有一款能听懂人话、写对汉字的AI了 别再等Sora了,字节Seedance 2.0才是AI视频的“导演时刻” Mistral 掀桌子:40亿参数跑本地,Voxtral 2 把延迟压进了200毫秒
你的笔记本也能跑“AI大神”!微软Phi-4-mini-flash-reasoning震撼登场 小米MiMo-VL:7B参数,怎么就成了多模态界的“越级打怪王”? GPT-5.2深夜炸场:为了让你每周少干10小时,OpenAI拼了 Java ABA问题原理及解决方法 Docker 常见的命令和常见问题集合(超详细) Kimi变身学术“卷王”,你的论文和报告还好吗?
标签聚合
java 大模型 设计模式 spring AI 算法 教程 开源

COPYRIGHT © 2023 墨风如雪博客. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang