栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

RapidOCR-完全开源免费并支持离线部署的多平台多语言OCR SDK

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

RapidOCR-完全开源免费并支持离线部署的多平台多语言OCR SDK

  • 小伙伴们,大家好,今天主要介绍一下RapidOCR,欢迎STAR, 欢迎PR, 欢迎转发。
  • 以下选自RapidOCR的README

RapidOCR (捷智OCR)

简体中文 | English

目录
  • RapidOCR (捷智OCR)
    • 简介
    • 近期更新(more)
      • 2022-07-10 update:
      • ✨2022-07-07 update:
    • 相关项目(more)
    • 生态框架
    • 常见问题 FAQ
    • 在线demo
    • 项目结构
    • 当前进展
    • 模型相关
      • 各个版本ONNX模型效果对比
        • 文本检测模型(仅供参考)
        • 文本识别模型(仅供参考)
        • 模型转onnx
    • 原始发起者及初创作者
    • 致谢
    • 赞助
    • 版权声明
    • 授权
    • 联系我们
    • 示例图
      • C++/JVM示例图像
      • .Net示例图像
      • 多语言示例图像
简介
  • 目前已知运行速度最快、支持最广,完全开源免费并支持离线部署的多平台多语言OCR SDK

  • 中文广告: 欢迎加入我们的QQ群下载模型及测试程序,qq群号:887298230

  • 缘起:百度paddlepaddle工程化不是太好,为了方便大家在各种端上进行ocr推理,我们将它转换为onnx格式,使用Python/C++/Java/Swift/C# 将它移植到各个平台。

  • 名称来源: 轻快好省并智能。 基于深度学习技术的OCR技术,主打人工智能优势及小模型,以速度为使命,效果为主导。

  • 基于百度的开源PaddleOCR 模型及训练,任何人可以使用本推理库,也可以根据自己的需求使用百度的paddlepaddle框架进行模型优化。

近期更新(more) 2022-07-10 update:
  • 添加onnxruntime-gpu的测试情况→link
  • 添加benchamark测试集 → link
  • 添加自动发布whl包的actions,当修改python/rapidocr_onnxruntime下代码时,会自动更新发布whl包。具体使用方法参见Whl README
✨2022-07-07 update:
  • 修复python版中v3 rec推理bug,并将v3 rec与v2 rec合并为同一套推理代码,更加简洁和方便
  • 添加python模块下的单元测试
  • 该页面添加致谢模块,感谢为这个项目作出贡献的小伙伴。
相关项目(more)
  • RapidVideOCR:基于RapidOCR,提取视频中的硬字幕
  • LGPMA_Infer: 表格结构还原 | 博客解读论文和源码
生态框架 常见问题 FAQ 在线demo
  • 说明: 本在线demo不存储小伙伴们上传测试的任何图像数据
  • demo所用模型组合(最优组合)为: ch_PP-OCRv3_det + ch_ppocr_mobile_v2.0_cls + ch_PP-OCRv3_rec
  • 运行机器配置: 4核 AMD EPYC 7K62 48-Core Processor
  • 示例图:
项目结构 (点击展开)
RapidOCR
├── android             # 安卓工程目录
├── api4cpp             # c语言跨平台接口库源码目录,直接用根下的CMakelists.txt 编译
├── assets              # 一些演示用的图片,不是测试集
├── commonlib           # 通用库
├── cpp                 # 基于c++的工程项目文件夹
├── docs                # 相关的一些说明文档
├── dotnet              # .Net程序目录
├── images              # 测试用图片,典型的测试图,一张是自然场景
├── include             # 编译c语言接口库时的头文件目录
├── ios                 # 苹果手机平台工程目录
├── jvm                 # 基于java的工程目录
├── lib                 # 编译用库文件目录,用于编译c语言接口库用,默认并不上传二进制文件
├── ocrweb              # 基于python和Flask web
├── python              # python推理代码目录
├── release             # 发布的sdk
└── tools               #  一些转换脚本之类
当前进展
  • C++范例(Windows/Linux/macOS): demo
  • Jvm范例(Java/Kotlin): demo
  • .Net范例(C#): demo
  • Android范例: demo
  • python范例: demo
  • OpenVINO加速版本,进行中
  • IOS范例: 等待有缘人贡献代码
  • 依据python版本重写C++推理代码,以提升推理效果,并增加对gif/tga/webp 格式图片的支持
模型相关
  • 可以直接下载使用的模型 (百度网盘 | Google Drive)
模型名称模型简介模型大小备注
⭐ ch_PP-OCRv3_det_infer.onnx轻量文本检测模型2.23M较v1轻量检测,精度有较大提升 from PaddleOCR
⭐ ch_PP-OCRv2_rec_infer.onnx轻量文本识别模型7.79M
各个版本ONNX模型效果对比 文本检测模型(仅供参考)
  • 测试集:自己构建中英文(111个,包含卡证、文档和自然图像)
模型infer_Speed(s/img)precisionrecallhmean模型大小
ch_ppocr_mobile_v2.0_det_infer.onnx0.43457420.72770.84130.77852.3M
ch_PP-OCRv2_det_infer.onnx0.51165530.78170.84720.81232.3M
ch_PP-OCRv3_det_infer.onnx0.57235120.77400.88370.82372.4M
文本识别模型(仅供参考)
  • 测试集: 自己构建中英文(168个)
模型infer_Speed(s/img)ScoreExact_MatchChar_Match模型大小
ch_ppocr_mobile_v2.0_rec_infer.onnx0.01110.72870.55950.89794.3M
ch_PP-OCRv2_rec_infer.onnx0.01930.69550.48810.90298.0M
ch_PP-OCRv3_rec_infer.onnx0.01450.55370.32740.780011M
ch_PP-OCRv3_rec_train_student.onnx0.01570.55370.32740.780011M
ch_PP-OCRv3_rec_train_teacher.onnx0.01400.53810.30950.766711M
模型转onnx
  • PaddleOCRModelConverter by @SWHL
  • Paddle2OnnxConvertor by @benjaminwan
  • 手把手教你使用ONNXRunTime部署PP-OCR by @Channingss
原始发起者及初创作者

致谢
  • 非常感谢DeliciaLaniD修复ocrweb中扫描动画起始位置错位问题。
  • 非常感谢zhsunlight关于参数化调用GPU推理的建议以及细致周到的测试。
  • 非常感谢lzh111222334修复python版本下rec前处理部分bug。
赞助
赞助者应用的产品
  • 如果您想要赞助该项目,可直接点击当前页最上面的Sponsor按钮,请写好备注,方便添加到上面赞助列表中。
版权声明
  • 如果你的产品使用了本仓库中的全部或部分代码、文字或材料
  • 请注明出处并包括我们的github url: https://github.com/RapidAI/RapidOCR
授权
  • OCR模型版权归百度所有,其它工程代码版权归本仓库所有者所有。
  • 本软件采用Apache 授权方式,欢迎大家贡献代码,提交issue 甚至pr.
联系我们
  • 您可以通过QQ群联系到我们:887298230
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/1025692.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号