设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

百度轻量级文字识别模型受开发者社区关注

发布时间: 来源: 中国科学报

 0mE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

近日,百度在海外官方账号介绍了最新轻量级文字识别模型PP-OCRv5,该模型仅0.07B参数,但在多项文字识别(OCR)场景测试中,识别精度堪与市面上部分7B参数大模型相媲美。据百度发布的信息显示,飞桨团队发布的技术博客已连续一周登顶“抱抱脸”(Hugging Face)博客热度榜首,受到开发者社区的广泛关注。0mE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

PP-OCRv5技术博客受关注。截图自Hugging Face

  ?0mE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

该博客指出,在OCR场景中,通用视觉大模型(VLM)在精确文本定位和边框精度上仍面临挑战,同时容易带来高计算开销和“幻觉”输出。相较于VLM,PP-OCRv5采用了模块化双阶段检测与识别方案,能够实现轻量高效推理与更精准的文本边界框输出。0mE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

测评数据显示,PP-OCRv5在中文识别(打印)、英文识别(打印)、英文识别(手写) 等核心任务上表现出色;在中文识别(手写) 、中文拼音识别等复杂场景中,能表现出强泛化能力。0mE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据了解,作为百度飞桨团队推出的全场景文字识别模型,PP-OCRv5是业界首个单模型支持5种文字类型的超轻量级(<100M)开源模型,且支持复杂手写体识别,可广泛应用于教育行业的试卷作业批改、医疗行业的病历数字化、法律行业的合同笔录数字化等多场景业务需求。0mE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据百度介绍,2025年5月,飞桨团队推出PaddleOCR 3.0,其特色方案能力包括文字识别、通用文档解析以及智能文档理解。自2020年开源以来,PaddleOCR累计下载量超900万,被数千个开源项目直接或间接使用,是GitHub 社区中唯一一个星标(Star)数量超过50k的中国OCR项目。0mE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM


0mE速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

教育、科技、人才三者相互促进、相辅相成。建设人才强国是实现建设教育强国和科技强国战略目标的关键条件。那么,一个重 郭永怀、李佩、王承书、王希季、邓稼先、王淦昌、钱骥……一串令人肃然起敬的名字,在中国科学院大学(以下简称国科大)师生 ■本报记者 冯丽妃 日本当地时间1月1日16时10分,日本西海岸石川县能登半岛发生7.6级地震,震源深度30公里。 截至 “这些小胶质细胞在tau蛋白病变有效地扩散到下一个细胞之前就开始吸收并降解tau蛋白。没有tau病理学,就不会有神经退 近日,上海市人社局等八部门联合出台《关于优化上海市博士后发展综合环境的实施意见》,新增“博士后国际合作交流”资 关于重点研发计划项目重大事项调整的公示 根据《湖南省创新型省份建设专项资金管理办法》(湘财教〔2023〕3号)和《 。

本文链接:百度轻量级文字识别模型受开发者社区关注http://www.sushuapos.com/show-11-26232-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 连续提取法实现黄麻叶高活性多糖的制备

下一篇: 藏式建筑保护传承与创新发展学术交流会举办

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜