大家好,我是平时爱折腾模型的某某。 翻译模型这个赛道,这几年其实挺卷的。但大多数时候,我们的认知还停留在“大力出奇迹”的阶段——想要在WMT24++基准测试中,TranslateGemma 12B的翻译质量竟然直接干翻译得信达雅,模型参数就得往死里堆。显卡在燃烧,电表在倒掉了Gemma 3自家的27B基线模型。 这意味着什么?意味着过去你需要一台昂转,最后出来的结果可能也就比谷歌翻译好那么一点点。 但谷歌最近放出的这个TranslateGemma,贵的服务器才能跑出来的翻译质量,现在在一台配置不错的消费级笔记本(比…
