别再死磕扩散模型了，MiniMax新开源揭示：视觉Tokenizer才是下一个金矿

在AI绘画和视频生成卷到飞起的今天，不管是大厂还是开源社区，大家似乎都陷入了一个怪圈：拼命堆算力去训练更大的Diffusion Transformer（DiT），指望通过增加生成模型的参数来获得更好的画质。但就在前两天，凭借海螺视频（Hailuo AI）在圈内名声大噪的MiniMax团队，突然开源了一个名为VTP（Visual Tokenizer Pre-training）的项目。看完他们的论文和代码，我不得不说，这帮人可能刚刚掀翻了视觉生成领域的桌子。他们抛出了一个极其反直觉的结论：如果我们一直在错误的地方用…