基于深度学习的中文点选验证码识别

https://blog.csdn.net/aaronjny/article/details/109732693 参考这篇博文进行基于深度学习的中文点选验证码的识别，组织数据的时候，也就是利用create_dataset()函数生成data.json文件时，我的正负样本数据的长度是不一样的，然后修改配置文件换成我的data.json文件，没法开始训练，训练了一个epoch就不动了。

我的json文件：正样本的个数是1，负样本的个数是2

[
  1,
  "D:\\python\\pythonProject_DP\\correct_words\\不_270_1.jpg",
  "D:\\python\\pythonProject_DP\\gen_words\\不_270_1.jpg"
],
[
  0,
  "D:\\python\\pythonProject_DP\\correct_words\\不_270_1.jpg",
  "D:\\python\\pythonProject_DP\\gen_words\\甩_270_2.jpg"
],
[
  0,
  "D:\\python\\pythonProject_DP\\correct_words\\不_270_1.jpg",
  "D:\\python\\pythonProject_DP\\gen_words\\糖_270_0.jpg"
]

训练的样子

@笔墨留年

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

极客智能体-在线 2023-04-22 14:28

关注

以下答案由GPT-3.5大模型与博主波罗歌共同编写：
首先，根据您提供的json文件格式，每个样本应该是一个数组或字典，而不是一段字符串。所以你需要将json文件改写成如下格式:

[
  {"label": 1,
   "correct_img_path": "D:\\python\\pythonProject_DP\\correct_words\\不_270_1.jpg",
   "generated_img_path": "D:\\python\\pythonProject_DP\\gen_words\\不_270_1.jpg"已黑化的小白   },
  {"label": 0,
   "correct_img_path": "D:\\python\\pythonProject_DP\\correct_words\\不_270_1.jpg",
   "generated_img_path": "D:\\python\\pythonProject_DP\\gen_words\\甩_270_2.jpg"已黑化的小白   },
  {"label": 0,
   "correct_img_path": "D:\\python\\pythonProject_DP\\correct_words\\不_270_1.jpg",
   "generated_img_path": "D:\\python\\pythonProject_DP\\gen_words\\糖_270_0.jpg"已黑化的小白   }
]

其次，在config.py文件中，您需要修改以下几个选项来适应新的数据集:

class Config:
    # ...
    json_path = 'data.json' # 修改为您的json文件路径
    train_n = 100  # 修改为您的训练集长度
    val_n = 20  # 修改为您的验证集长度
    batch_size = 10  # 修改为您的batch_size大小
    # ...

然后，对于长度不同的正负样本数据，您可以使用numpy的repeat函数将正样本数据复制到与负样本数量相同的长度，例如:

import numpy as np

correct_data = np.array([...])  # 正样本数据
negative_data = np.array([...])  # 负样本数据

if len(correct_data) < len(negative_data):
    repeated_correct_data = np.repeat(correct_data, len(negative_data) // len(correct_data), axis=0)
    remaining_correct_data = correct_data[:len(negative_data) % len(correct_data)]
    final_correct_data = np.concatenate((repeated_correct_data, remaining_correct_data), axis=0)
    final_data = np.concatenate((positive_data, negative_data), axis=0)
else:
    final_data = np.concatenate((positive_data[:len(negative_data)], negative_data), axis=0)

最后，如果问题仍未解决，请检查您的数据格式、路径和代码实现等。如果需要，您可以在这里提供更多的细节或代码片段，以便我可以更好地帮助您解决问题。
如果我的回答解决了您的问题，请采纳！

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

基于深度学习的中文点选验证码识别 python 深度学习
2023-04-22 11:36

回答 2 已采纳以下答案由GPT-3.5大模型与博主波罗歌共同编写：首先，根据您提供的json文件格式，每个样本应该是一个数组或字典，而不是一段字符串。所以你需要将json文件改写成如下格式: [ {"label
基于深度学习的棉花根系表型性状精准识别 c++ 有问必答
2022-03-11 21:55

回答 2 已采纳 python写程序就行，需要安装深度学习环境，比如tensorflow
关于深度学习的一点问题 python 深度学习神经网络
2022-08-11 13:55

回答 1 已采纳意思是未来的版本会移除这个方法（但是现在还没有）。所以除非你升级tf版本不然的话放着就可以了要是强迫症的话把报错等级调高就可以了
基于深度学习的验证码识别方法设计与实现
2023-11-27 15:16

本课题主要商议了基于深度学习的验证码识别方法设计与实现。具体地，第一步采集验证码图像。这些验证码图像来源有两种：一是通过编程仿照常见的验证码图像生成数据集；二是从站上下载验证码图像保存成数据集。第二步...
深度学习的人体目标识别跟踪深度学习目标跟踪
2017-04-05 10:27

回答 1 已采纳实现分类是什么意思呢？对什么做了分类？如果你用了他训练好的模型实现了你自己的图片的分类，那你的任务已经完成的差不多了。你可以试着根据你的处理速度，对视频按照固定的帧捕捉成一个个图片，这个样话对视频的处
ctc 验证码识别 ValueError: No gradients provided for any variable tensorflow 深度学习神经网络自然语言处理
2020-08-11 13:13

回答 1 已采纳 https://blog.csdn.net/qq_35276242/article/details/97172432
关于#深度学习#的问题： bert 深度学习自然语言处理
2023-02-11 15:35

回答 4 已采纳有些模型，不是公开的，或者需要一些协议，必须登录才行。你参考下 https://blog.csdn.net/YI_SHU_JIA/article/details/127490591
基于深度学习的验证码识别python源码+文档说明
2024-04-21 05:05

-通过Python编程语言和TensorFlow/Keras框架构建一个高效的验证码识别系统。 -数据集： python 的 captcha 库生成验证码图片。用TensorFlow 的 Dataset API 定义数据管道。 -模型：CNN。迁移学习和多任务学习,加载预...
基于python做神经网络、深度学习需不需要自己写代码，需要写到什么程度呢？ python 有问必答深度学习神经网络
2022-05-16 13:12

回答 6 已采纳的确是很多第三方库给你去用，直接import就可以，但是问题是，如果目前出了问题，第三方库无法满足你的需求，你需要进一步修改代码你怎么办？而且这个问题在实际应用中是经常碰见的，这时候你会不会神经网络基
如何入门机器学习/深度学习进行大数据分析？机器学习深度学习自然语言处理
2022-10-12 12:55

回答 1 已采纳先学理论，实现的时候顺带学习python，这样的话python就会不知不觉中学会了。当然，你也可以先学一些基础的python语法，做一些简单的小实验，然后在开始理论的学习。机器学习的话基本上吴恩达的视
深度学习与深度迁移学习有什么区别深度学习迁移学习
2022-04-14 10:12

回答 1 已采纳如果你对深度学习有一定理解的话，深度迁移学习你可以理解为：深度学习使用A方法对A数据集训练，完成了既定的目标。在A的基础之上举一反三，是将已经学习到的知识迁移到另一种未知的知识的学习（即从源域迁移到目
深度学习基于SwinTransformer的验证码识别python源码+项目运行说明.zip
2024-01-16 20:03

深度学习基于SwinTransformer的验证码识别python源码+项目运行说明.zip 如果需要自己训练模型 1.重新生成数据集，运行captcha.py 2.预处理，运行preprocess.py,将把生成的数据集分为训练集、验证集、测试集，保存在...
深度学习有关dropout层的问题 python 深度学习神经网络自然语言处理
2020-10-24 09:58

回答 1 已采纳这个是需要自己去添加并调节drop率
Python 基于 TensorFlow 的深度学习图片验证码的解决方案.zip
2023-02-05 22:19

Python 基于 TensorFlow 的深度学习图片验证码的解决方案。基于深度学习的图片验证码的解决方案 - 该项目能够秒杀字符粘连重叠/透视变形/模糊/噪声等各种干扰情况，足以解决市面上绝大多数复杂的验证码场景，目前...
使用深度学习进行验证码识别系统搭建（附项目资源）
2023-07-22 09:07

粥粥坠腻害的博客本文详细介绍了如何使用TensorFlow和Keras构建一个端到端的验证码识别模型,内容涵盖数据集生成、模型设计、训练和测试等过程,可以作为验证码识别任务的入门指南。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 4月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月22日

悬赏问题

¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
¥15 cmd cl 0x000007b
¥20 BAPI_PR_CHANGE how to add account assignment information for service line
¥500 火焰左右视图、视差（基于双目相机）
¥100 set_link_state
¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统

基于深度学习的中文点选验证码识别

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新