ocr文档字符识别没有结果

识别小票那个例子的源代码
文档中第二张英文图片识别不出结果中间图片处理过程可以展示就是终端无结果

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-04-17 19:27
关注
引自免费微信小程序：皆我百晓生

在处理OCR（光学字符识别）时，遇到无法正确识别的情况，可能的原因有很多，包括图像质量、字体类型、光照条件等。针对你描述的问题，我们可以按照以下步骤进行排查和优化：

图像预处理：确保输入的图像清晰，没有模糊、偏色、噪点等问题。
色彩转换：将彩色图像转换为灰度图像，有助于提高识别效果。
二值化：通过阈值处理将图像转换为黑白二值图，便于后续的文字提取。
边缘检测：找到文字边界，排除背景干扰。
字符分割：将连在一起的字符分开，方便单独识别。
OCR引擎选择：尝试不同的OCR引擎，比如Tesseract、PaddleOCR、EasyOCR等。

下面是一个基于Python和Tesseract OCR的简单示例。如果你还没有安装Tesseract，可以通过pip安装：

pip install pytesseract

接下来是代码示例：

import cv2 import pytesseract from PIL import Image # 加载图像 image = cv2.imread('your_image_path.jpg') gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 阈值处理 _, binary_image = cv2.threshold(gray_image, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU) # 使用PIL进行进一步处理 binary_pil = Image.fromarray(binary_image) processed_image = binary_pil.convert("L") # 进行OCR识别 text = pytesseract.image_to_string(processed_image, lang='eng', config='--psm 6') print(text)

在这段代码中，我们首先读取图像并将其转换为灰度。然后，我们应用Otsu's二值化方法自动确定阈值，将图像转换为黑白。接着，我们将二值图像转换为PIL图像，并将其转换为单色模式。最后，我们使用Tesseract进行OCR识别，指定语言为英语，并设置参数--psm 6来处理多列文本。

如果这个基本流程仍无法解决你的问题，你可能需要尝试调整图像处理步骤，例如调整阈值、使用不同的边缘检测算法（如Canny、Sobel等），或者对图像进行旋转、缩放等操作以适应OCR引擎。

如果你还有其他具体问题，比如关于代码的具体部分不理解，或者想要尝试其他的OCR库，随时告诉我，我会提供更多的指导和帮助。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

tesseract-OCR如何通过vba语言获取识别字符串，而不通过生成txt文件的方式 python 有问必答
2021-05-02 21:32

回答 5 已采纳孙老师，这样的方法我理解，但是会出现exe运行边框，很难去除。那如何实现无边框运行，我试过采用输入一段代码，但还是有边框闪烁。
在学习Python实现OCR识别的时候遇到问题 python 开发语言有问必答
2023-03-02 15:07

回答 4 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵ在OCR识别的过程中，可能会出现很多干扰信息，需要进行过滤，只提取出自己需要的信息。具体实现方法可能因为不同的OCR引擎和识别场景而有所差异，但一般可以按以下步骤进行：对
Tesseract-ocr 库无法识别图片 python 有问必答
2021-06-17 17:20

回答 2 已采纳图片放哪里都行，你路径没写对或者引入路径的格式写错了
Halcon联合C#的OCR字符识别系统
2018-06-28 15:06

在当今信息化时代，光学字符识别（OCR）技术在各个领域中发挥着重要的作用，特别是在文档处理、自动化检测和图像处理方面。本文将深入探讨一个基于Halcon与C#的OCR字符识别系统，其强大的功能和灵活的操作模式为用户...
带带dd ocr模块，识别用不了 python
2021-12-21 19:29

回答 1 已采纳 ocr = ddddocr.DdddOcr()试试
dm.ocr 识别的数字怎么会少一位呢？ c语言有问必答
2021-04-16 23:11

回答 6 已采纳你发的2张图片看不到呢，重新贴一些图片。
OCR文字识别可以脱离Tesseract-OCR环境使用吗？ python
2022-07-19 23:00

回答 2 已采纳不能，Tesseract是他的框架
OCR.zip_OCR_exidcard_字符识别
2022-09-14 23:45

标题中的"OCR.zip_OCR_exidcard_字符识别"揭示了这个压缩包文件的主要内容，它涉及到了光学字符识别（OCR）技术，特别是针对身份证（exidcard）的字符识别。OCR是一种计算机技术，用于将图像中的印刷体或手写文字...
用ocr识别文字表格后，格式内容很乱，有没有什么算法可恢复成原有的数据结构？算法
2022-08-26 10:00

回答 1 已采纳这个算法是有的，很多机器学习的公司都可以做，但是不可能白给你做。我知道有一个公司在做这是他们的官网：http://www.chinaai.org.cn/ 你可以看一下
图片识别OCR，将图片上的文字识别出来
2015-11-11 09:55

回答 2 已采纳 OCR识别图片的一些实例　OCR 图片文字识别图解教程图片文字识别的两种简便方法----------------------同志你好，我是CSDN问答机器人小N，奉组织之命为你提供参考答案，编程尚未成
QT+opencv进行OCR数字识别，样本图库的问题~ opencv qt
2018-05-09 08:02

回答 3 已采纳举个例子，比如我现在有50个‘0’的图片的样本供于训练神经网络，但是现在我需要仿宋字体的图片样本来训练神经网络。我现在有的50张‘0’的图片是身份证的数字‘0’的样本，如图。我的目标是生成50张仿宋‘
Tesseract_OCR字符识别模块_
2021-10-02 07:27

**Tesseract OCR字符识别模块详解** Tesseract OCR（Optical Character Recognition，光学字符识别）是一种开源的、强大的字符识别引擎，由HP公司在1985年开发，后由Google维护和改进。它能够从图像中识别出文本，...
变成MFC实现halcon字符变MFC字符串时 c++ c语言开发语言
2021-04-28 22:27

回答 1 已采纳 const char *pStr=NULL; HString hsHS; CString strCS; hsHS=("adslj,3434asdf"); //strCS.Format("%s",&h
C# winform OCR文字识别
2024-03-26 15:24

在IT领域，OCR（Optical Character Recognition，光学字符识别）技术是一种将图像中的文本转换为机器编码文本的技术，常用于扫描文档、图片等场景。在本项目“C# winform OCR文字识别”中，我们将探讨如何利用C#编程...
tesseract OCR 字符识别，中英文都有库，C#封装，有例子
2021-10-28 09:13

Tesseract OCR（Optical Character Recognition，光学字符识别）是一种开源的文本识别引擎，最初由HP开发，后来由谷歌维护。它具有强大的字符识别能力，支持多种语言，包括中英文，使得它可以广泛应用于各种需要自动...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月17日

悬赏问题

¥15 is not in the mmseg::model registry。报错，模型注册表找不到自定义模块。
¥15 安装quartus II18.1时弹出此error，怎么解决？
¥15 keil官网下载psn序列号在哪
¥15 想用adb命令做一个通话软件，播放录音
¥30 Pytorch深度学习服务器跑不通问题解决？
¥15 部分客户订单定位有误的问题
¥15 如何在maya程序中利用python编写领子和褶裥的模型的方法
¥15 Bug traq 数据包大概什么价
¥15 在anaconda上pytorch和paddle paddle下载报错
¥25 自动填写QQ腾讯文档收集表

ocr文档字符识别 没有结果

5条回答 默认 最新

问题事件

悬赏问题

ocr文档字符识别没有结果

5条回答默认最新