做过文档解析的开发者都有过这种绝望时刻:面对一份排版复杂的PDF或一张字迹潦草的报销单,传统OCR只会给你吐出一堆乱序的字符,而动用GPT-4V这种通用大模型又像是“大炮打蚊子”——既烧钱又慢得让人心焦。 就在2026年2月3日,智谱AI甩出了一个让开源社区炸锅的项目——GLM-OCR。这款模型最让人惊讶的不是它能做什么,而是它“怎么做到的”。 它只有0.9B(90亿)参数。 在动辄千亿参数的大模型时代,0.9B听起来像是玩具。但正是这个“小个子”,在权威的OmniDocBench V1.5榜单上拿下了94.6分,…
