采用
pytesseract.image_to_data()
import pytesseractfrom pytesseract import Outputimport cv2img = cv2.imread('image.jpg')d = pytesseract.image_to_data(img, output_type=Output.DICT)n_boxes = len(d['level'])for i in range(n_boxes): (x, y, w, h) = (d['left'][i], d['top'][i], d['width'][i], d['height'][i]) cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 2)cv2.imshow('img', img)cv2.waitKey(0)在返回的数据中
pytesseract.image_to_data():
left
是从边界框的左上角到图像左边界的距离。top
是从边界框的左上角到图像顶部的距离。width
和height
是边框的宽度和高度。conf
是模型对该边界框内单词的预测的置信度。如果conf
为-1,则表示相应的边界框包含一个文本块,而不只是一个单词。
pytesseract.image_to_boxes()包围字母返回的包围盒,所以我相信这
pytesseract.image_to_data()是您想要的。



