python使用Ddorc解析图片验证码出现问题

通过python使用Ddorc进行图片验证码解析时，出现了报错，但是验证码正确解析了出来，如图

红色异常部分经解析，为Expected shape from model of {1,19} does not match actual shape of {1,24} for output
部分python代码为

import ddddocr

cap_imgdata=cap_reponse.content
cap_image=Image.open(io.BytesIO(cap_imgdata))
buf = io.BytesIO()
cap_image.save(buf, format="PNG")
img_bytes = buf.getvalue()
orc = ddddocr.DdddOcr()
results = orc.classification(img_bytes)
print(results)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-04-29 14:40
关注
引自免费微信小程序：皆我百晓生

根据您提供的信息，看起来您在使用DDDOrc进行图像识别时遇到了一个形状不匹配的错误。这个错误是因为模型期望的输入形状与实际接收到的形状不同。

您的代码显示了对一张图片进行处理并使用DDDOrc进行识别的过程。然而，错误提示表明模型期望的输出形状是(1, 19)，但实际得到的是(1, 24)。这可能意味着模型可能只训练用于处理特定大小的文本，而当前的验证码图片包含额外的字符。

解决这个问题的方法之一是尝试调整图片尺寸或对图片进行裁剪，使其内容更符合模型的预期。您可以先尝试将验证码图片拉伸或压缩到合适的宽度（例如，如果每个字符占据固定宽度，可以尝试减少宽度）。下面是一个简单的示例，展示了如何在PIL库的帮助下调整图片宽度：

from PIL import Image # 假设您已经定义了一个函数来获取验证码图片的合适宽度 def get_expected_width(): # 根据模型需求计算宽度，这里仅作演示，实际情况需要调整 return 19 * 10 # 假设每个字符宽10像素，总共19个字符 def resize_image_to_fit(image, expected_width): height = int(image.height * (expected_width / image.width)) resized_image = image.resize((expected_width, height), resample=Image.BICUBIC) return resized_image cap_image = Image.open(io.BytesIO(cap_imgdata)) resized_cap_image = resize_image_to_fit(cap_image, get_expected_width()) buf = io.BytesIO() resized_cap_image.save(buf, format="PNG") img_bytes = buf.getvalue() orc = ddddocr.DdddOcr() results = orc.classification(img_bytes) print(results)

这段代码首先定义了一个get_expected_width()函数来计算期望的宽度，然后定义了一个resize_image_to_fit()函数来按比例缩放图像。接下来，我们对原始图片进行缩放，并再次尝试进行OCR识别。

请确保根据您的具体情况进行调整，特别是get_expected_width()函数，以便为您的模型提供正确的宽度。如果问题仍然存在，您可能需要检查模型是否支持可变长度的输入，或者考虑使用其他能处理任意长度验证码的OCR库。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用python 对验证码图片进行降噪处理
2020-12-23 07:04

首先贴一张验证码上来做案例：第一步先通过二值化处理把干扰线去掉： from PIL import Image # 二值化处理 def two_value(): for i in range(1,5): # 打开文件夹中的图片 image=Image.open('./Img/'+str(i)+'....
Python解析最简单的验证码
2020-12-25 08:20

不过这是另外的话题，开始的时候我并没有发现这个隐藏起来的秘密，所以我就写了这个python代码段用来实现解析验证码的功能。　我们学校的验证码是最简单的验证码，形式大概如下：　其中这个图片的大小是60X24...
使用python+robot framework识别图片验证码
2016-06-20 17:01

本篇将详细讲解如何使用Python和Robot Framework相结合来识别图片验证码，以及如何利用PIL库进行图像处理，以及提到了一个用于识别验证码的第三方库——pytesser。首先，让我们了解Python和Robot Framework的基本...
Python基于CNN的验证码图片识别.zip
2022-05-13 17:37

Python基于CNN的验证码图片识别 Python基于CNN的验证码图片识别 Python基于CNN的验证码图片识别 Python基于CNN的验证码图片识别 Python基于CNN的验证码图片识别 ...
python 验证码图片识别源代码
2019-02-26 07:16

Python作为流行的编程语言，提供了许多库来支持此类任务。本项目提供的"python 验证码图片识别源代码"是一个实用的示例，适用于学生进行课程设计或毕业设计时参考。验证码识别通常涉及以下几个关键知识点： 1. **...
(一)python爬虫验证码识别（去除干扰线）
2019-04-08 19:21

这篇文章将探讨如何使用Python处理带有干扰线的验证码识别问题。首先，我们需要了解验证码识别的基本原理和涉及的技术。验证码识别通常分为几个步骤：图片预处理、特征提取、模型训练以及识别应用。在本案例中，...
Python源码14如何获取网页中动态加载的验证码图片.zip
2025-01-23 12:52

本篇内容将详细探讨如何使用Python语言来获取网页中动态加载的验证码图片。首先，要处理动态验证码，需要了解网页的工作原理。通常，动态验证码通过JavaScript动态生成，并在特定时间间隔后更新。因此，直接使用...
Python计划快速入门-14 Python 基本编程解析（上）1.mp4
2022-05-19 18:31

Python计划快速入门-14 Python 基本编程解析（上）1.mp4
Python计划快速入门-14 Python 基本编程解析（上）4.mp4
2022-05-17 22:01

Python计划快速入门-14 Python 基本编程解析（上）4.mp4
pyocr:利用 tesseract 解析简单数字验证码图片
2021-05-17 09:11

利用 tesseract 解析简单数字验证码图片 tesseract 是一个 OCR（Optical Character Recognition，光学字符识别）引擎，能够识别图片中字符，利用这个可以用来解析一些简单的图片验证码 Github 地址： Windows 平台 v...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月29日

python使用Ddorc解析图片验证码出现问题

6条回答 默认 最新

问题事件

6条回答默认最新