栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Windows使用tesserocr识别图片

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Windows使用tesserocr识别图片

Windows使用tesserocr识别图片 pip安装tesserocr

下载地址:https://github.com/simonflueckiger/tesserocr-windows_build/releases

例如,python版本是win32的3.7,须下载tesserocr-2.4.0-cp37-cp37m-win32.whl

安装:pip install tesserocr-2.4.0-cp37-cp37m-win32.whl

下载tesseract

下载地址:https://digi.bib.uni-mannheim.de/tesseract/

注意:ACT安装版本需要与OCR的支持版本保持一致!

安装:双击安装即可!

项目使用 程序
import tesserocr
from PIL import Image

def image2word(path, lang):
    try:
        image = Image.open(path)
        words = tesserocr.image_to_text(image, lang=lang)
        return words
    except (OSError, NameError):
        return 'Error!'

1、如果报错:Failed to init API, possibly an invalid tessdata path {A}

需要将Tesseract-OCR目录下的tessdata文件夹拷贝到A目录下!

2、其中lang默认是eng,即识别英文,可以根据ISO 639-3标准赋予其他语言,如韩语kor

注意:如果tesseract未安装相应语言包,项目中却使用到此语言包,会报错:

Failed to init API, possibly an invalid tessdata path
查看已安装语言
cd {ocr安装路径/Tesseract-OCR}
./tesseract --list-langs

安装语言包

下载地址:https://tesseract-ocr.github.io/tessdoc/Data-Files

如图所示,直接点击相应语言的下载链接,下载到本地,之后将下载的文件拷贝到Tesseract-OCRtessdata目录下,以及A目录tessdata目录下!


国内的PaddleOCR效果更强一些,项目地址:https://github.com/PaddlePaddle/PaddleOCR

如果有机会,会发一篇文章对比两者间的效果差异!

♥ 喜 欢 请 点 赞 哟 ♥
(●ˇ∀ˇ●)
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/738264.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号