据了解,该模型核心参数仅0.9B,轻量高效,能以极低计算开销精准识别文本、手写汉字、表格、公式、图表等复杂元素,支持109种语言。在权威榜单OmniBenchDoc V1.5中,它以92.6分获综合性能全球第一,四大核心能力全线SOTA,超越GPT-4o等模型,刷新OCR VL模型性能纪录。
作为文心4.5衍生模型,PaddleOCR-VL融合了NaViT动态分辨率视觉编码器与ERNIE-4.5-0.3B语言模型,实现精度与效率双突破。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
上一篇:全球八成音响中国造,音频产业进入AI“无界声学”时代...
下一篇:返回列表
近日,“晋韵华章”主题短视频、微短剧产创大赛颁奖活动在山西晋中市举办,经评审...
2025-10-25 16:56:05
????近日,我国商业航天在核心技术自主化上取得关键性跨越。据悉,“微光启航...
2025-10-25 15:36:39
10月24日,在第40届物流产业高质量发展大会上,中国物流行业迎来了一份具有...
2025-10-25 15:20:51
如今,乳企出海的逻辑正在发生转变,从为了“引进来”而“走出去”,逐渐转变为品...
2025-10-25 15:02:22
10月23日至26日,第三届鸟巢数字体验节暨机器人科技嘉年华在国家体育场文化...
2025-10-25 14:27:58
“Verygood!”“Amazing(味道太棒了)!”10月15日,在美国...
2025-10-25 14:21:47
广西壮族自治区发展改革委25日披露的数据显示,前三季度广西GDP同比增长5....
2025-10-25 13:36:25
10月22日,“智赋八桂玉联东盟”中小企业数智化创新应用大赛颁奖仪式在玉林举...
2025-10-25 13:34:06
10月24日,百度百科联合知名科普期刊《大学科普》期刊编委会和中国科学院大学...
2025-10-25 13:03:02
围绕娃哈哈的博弈,又出现巨大反转。 据中国新闻周刊援引媒体报道,宗馥莉所控...
2025-10-25 12:54:13