栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Tesseract OCR文字识别

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Tesseract OCR文字识别

Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。2005年,Tesseract由美国内华达州信息技术研究所获得,并求诸于Google对Tesseract进行改进、消除Bug、优化工作。

环境: 1.VScode安装

都会的

2.安装pytesseract
pip install pytesseract
3. 安装 tesseract orc

https://github.com/UB-Mannheim/tesseract/wiki
现在有版本5了,下载.exe后安装,记住安装路径(重要)。

4.配置tesseract运行文件

进入路径c:users31331appdatalocalprogramspythonpython38libsite-packages,找你们自己的
找到pytesseract下的pytesseract.py,找到tesseract_cmd = 'tesseract'
‘ ’里面修改为你刚才记住的路径

5.文字识别
from PIL import Image
import pytesseract

path = "img\text-img.png"

text = pytesseract.image_to_string(Image.open(path), lang='chi_sim')
print(text)

代码如下,自己去找一张图片就可以跑了。
原图
效果图

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/618419.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号