突然的想法:有些图片里有文字,但是图片里面的内容不可以直接复制,每次在网上找ocr网站都需要一些时间,有些更是需要付费。那为什么我不自己试试写一个python的脚本获取我自己剪切板的图片并使用ocr库直接提取图片内容呢。
在网上查了一些资料以后选择使用Pillow进行剪切板的内容获取。
from PIL import Image, ImageGrab
# 保存剪切板内图片
im = ImageGrab.grabclipboard()
if isinstance(im, Image.Image):
print("Image: size : %s, mode: %s" % (im.size, im.mode))
im.save("C:\Users\37767\Desktop\grab_clipboard.jpg")
elif im:
for filename in im:
print("filename:%s" % filename)
im = Image.open(filename)
else:
print("clipboard is empty")
将获取的图片保存下来以后储存在桌面上,每次剪切板里的图片会替换掉上一次的图片。
再使用easyocr进行识别内容。
import easyocr
# OCR识别截图
reader = easyocr.Reader(['ch_sim', 'en'])
result = reader.readtext('C:\Users\37767\Desktop\grab_clipboard.jpg')
print(result)
file = open("C:\Users\37767\Desktop\1.txt", 'w')
file.write(str(result))
file.close()
进行一次试验
对这张图片识别
然后发现其实easyocr的准确度不尽如人意。后面准备改进一下。



