#计算机视觉 #Tesseract-OCR

在使用pytesseract进行数据识别提取的时候遇到同一屏幕截取的两张图片，能识别其中一张，但是另一张却不能正确识别。

使用pillow第三方包如何对上面两张图片进行预处理，可以实现对数据的识别提取。

import os
from PIL import Image
import pytesseract
import openpyxl
import re


def preprocess_image(image_path):
    img = Image.open(image_path)
    img = img.convert("L")  # Convert image to grayscale
    img = img.point(lambda x: 0 if x <100 else 255, "1")  # Binarize the image using a threshold of 128
    return img


def extract_text(image):
    text = pytesseract.image_to_string(image, config=custom_config)
    return text


# Main function
def main(image_path):
    # Preprocess the image
    preprocessed_image = preprocess_image(image_path)
    # Extract text from the preprocessed image
    extracted_text = extract_text(preprocessed_image)
    # Print the extracted text
    extracted_text_list = [extracted_text]  # Convert extracted text to a list
    # Extract the decimal numbers with 5 decimal places
    decimal_numbers = re.findall(r'\d+\.\d{5}', extracted_text_list[0])

    # Print the extracted decimal numbers
    for number in decimal_numbers:
        float_number = float(number)
        worksheet.append([image_name, float_number])


image_folder_path = r'C:\Desktop\新建文件夹' #图片文件所在的路径
output_xlsx_path = os.path.join(image_folder_path, "{}.xlsx".format(image_folder_path.split('\\')[-1]))
custom_config = r'--oem 3 --psm 6'


#  初始化XLSX工作簿和工作表
workbook = openpyxl.Workbook()
worksheet = workbook.active

# 遍历文件夹及其子文件夹
for root, dirs, files in os.walk(image_folder_path):
    for file in files:
        if file.endswith('.jpeg'):
            image_path = os.path.join(root, file)
            image_name = os.path.splitext(file)[0]
            # 对图像进行OCR识别
            main(image_path)

# 保存数据文件
workbook.save(output_xlsx_path)

print("完成数据识别并将数据保存！")

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

17条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Haven55555 2023-11-13 17:50
关注
获得0.30元问题酬金

这个可能要看下怎么预处理的，如果字体都是不同颜色的，可能会有影响字体的匹配，在识别前将图片处理成灰度图，再就是背景板杂乱内容比较多需要过滤掉一些不必要的内容，减少对识别干扰，

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【计算机视觉】Tesseract-开源 OCR（Optical Character Recognition，光学字符识别）引擎介绍
2025-06-13 15:05

晴雨日记的博客 OCR引擎它的核心任务是将包含文本的图像（如扫描的文档、照片、PDF 页面截图等）转换成机器可读、可编辑的文本
Tesseract-OCR模型包
2026-01-07 11:48

随着计算机视觉和人工智能技术的发展，Tesseract-OCR也在不断更新，以适应更多样化的识别需求。它的多功能性以及开源特性，使其成为了软件开发人员、科研人员以及企业用户在处理图像识别和文档自动化任务时的重要...
qt halcon tesseract-ocr 文字识别
2018-05-01 14:16

在IT领域，文本识别是一项重要的技术，特别是在自动化和人工智能应用中。本项目“qt halcon tesseract-ocr 文字识别”结合了三个关键技术：Qt、Halcon和Tesseract OCR，用于实现图像处理和高精度的文字识别。以下是...
OpenCV学习笔记11-Tesseract-OCR的安装和使用
2022-04-17 08:00

Aaron-ywl的博客 1OCR介绍光学字符识别(Optical Character Recognition)简称为“OCR”。ORC是指对包含文本资料的图像文件进行分析识别处理，获取文字及版面信息的技术。光学字符识别是通过图像处理和模式识别技术对光学的字符...
python+Tesseract-OCR实现OCR识别
2022-03-04 17:17

郭庆汝的博客 python+Tesseract-OCR实现OCR识别1、下载地址如下：2、安装完毕后，配置环境变量（本次安装在了C盘）3、测试安装是否成功：4、在python环境中安装依赖包：5、修改相关文件路径6、python调用代码如下： 1、下载地址...
tesseract-ocr-w64-setup-v5.0.0-alpha.20191030.zip
2021-07-09 18:57

《Tesseract OCR 5.0.0 Alpha 20191030：智能文本识别技术的里程碑》 Tesseract OCR（Optical Character Recognition，光学字符识别）是一款由谷歌维护的开源OCR引擎，它的历史可以追溯到1985年，由HP公司研发。...
【计算机视觉】Car-Plate-Detection-OpenCV-TesseractOCR：车牌检测与识别
2025-05-09 20:29

白熊188的博客 Car-Plate-Detection-OpenCV-TesseractOCR：车牌检测与识别技术深度解析
使用tesseract-ocr实现图片中的中英文字符提取
2023-11-16 11:34

源启智能的博客 OCR(Optical Character Recognition)：光学字符识别,...Tesseract：开源的OCR识别引擎，初期Tesseract引擎由HP实验室研发，后来贡献给了开源软件业，后经由Google进行改进，消除bug，优化，重新发布，支持100多种语言。
Tesseract-OCR 中文训练库详解与实践
2025-07-05 03:17

想法臃肿的博客 Tesseract OCR是一个开源的光学字符识别引擎，最初由惠普公司开发并于1985年发布。随后，该技术在2006年被转为开源软件，并由谷歌进行维护和开发。Tesseract因其实用性和较高的识别准确度而受到全球开发者的青睐，...
基于OpenCV+tesseract-ocr实现身份证识别.zip
2025-09-15 12:25

身份证识别技术是一种重要的图像识别应用，它通过分析...最后，随着人工智能技术的发展，基于深度学习的图像识别技术不断进步，未来的身份证识别系统将更加智能化，识别准确率也将进一步提高，应用范围也会更加广泛。
Tesseract-OCR对图像和PDF进行光学文字识别
2022-01-13 13:12

程序员猴小萌的博客本文主要介绍Tesseract-OCR光学文字识别应用程序的下载安装、运行参数，以及gImageReader图形界面，并Ubuntu和Windows环境下演示了使用图形界面对PDF和图像文件进行文字识别的效果
基于Emgu.CV.OCR和tesseract-ocr制作的档案著录工具
2023-03-07 14:33

Emgu.CV.OCR是基于开源计算机视觉库OpenCV的.NET封装，它提供了强大的图像处理和模式识别功能。OpenCV本身拥有丰富的图像处理算法，包括滤波、边缘检测、特征匹配等，而Emgu.CV.OCR则在此基础上进一步实现了OCR...
OpenCV Python + Tesseract-OCR轻松实现中文识别
2021-01-02 10:08

小白学视觉的博客点击上方“小白学视觉”，选择加"星标"或“置顶” 重磅干货，第一时间送达推荐阅读 42个pycharm使用技巧，瞬间从黑铁变王者Google C++项目编程风格指南 ...
Tesseract-OCR 的安装与使用
2018-07-28 16:17

NPU_Li Meng的博客查阅了很多信息，选取了Tesseract。 What is Tesseract ？ Tesseract是能够运行在多种操作系统上的开源ORC（Optical Character Recognition , 光学字符识别）引擎，目前由Google维护，是最精确的开源ORC引擎之一...
开源Tesseract-OCR文本识别引擎实战详解
2025-09-25 23:52

Randy Rhoads的博客 Tesseract 提供了用户词典（User Words）机制，允许注入领域专有词汇。用户词典文件为纯文本，每行一个单词，格式如下：糖尿病高血压CT扫描MRI成像心电图保存为后，通过配置文件启用：然后在调用时指定：Python 接口...
OpenCv —— Vs2017编译Tesseract-OCR
2023-03-29 10:08

信必诺的博客 Vs2017编译Tesseract-OCR
tesseract-OCR安装包及中文语言包资源下载：一键识别中文文本，Python开发者必备工具
2025-05-13 00:12

石婵熠Orlena的博客 tesseract-OCR安装包及中文语言包资源下载：一键识别中文文本，Python开发者必备工具【下载地址】tesseract-OCR安装包及中文语言包资源下载该开源项目提供了 tesseract-OCR 安装包及中文语言包资源，专为 ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 11月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月13日