训练paddleOCR文字方向模型的时候发生错误，如何解决？

问题遇到的现象和发生背景

训练paddleOCR文字方向模型的时候发生错误
数据格式是正确的，在同事电脑上已经跑过，在我电脑上就不行

操作环境、软件版本等信息

window10
Python 3.8.19

尝试过的解决方法

百度 Google gpt都无解

我想要达到的结果

想正常跑通代码
这是我的配置文件：

Global:
  use_gpu: True
  epoch_num: 100
  log_smooth_window: 20
  print_batch_step: 10
  save_model_dir: ./output/cls/mv3/
  save_epoch_step: 3
  # evaluation is run every 5000 iterations after the 4000th iteration
  eval_batch_step: [0, 1000]
  cal_metric_during_train: True
  pretrained_model:
  checkpoints:
  save_inference_dir:
  use_visualdl: False
  infer_img: doc/imgs_words_en/word_10.png
  label_list: ['0','180']

Architecture:
  model_type: cls
  algorithm: CLS
  Transform:
  Backbone:
    name: MobileNetV3
    scale: 0.35
    model_name: small
  Neck:
  Head:
    name: ClsHead
    class_dim: 2

Loss:
  name: ClsLoss

Optimizer:
  name: Adam
  beta1: 0.9
  beta2: 0.999
  lr:
    name: Cosine
    learning_rate: 0.001
  regularizer:
    name: 'L2'
    factor: 0

PostProcess:
  name: ClsPostProcess

Metric:
  name: ClsMetric
  main_indicator: acc

Train:
  dataset:
    name: SimpleDataSet
    data_dir: ./train_data/cls/train
    label_file_list:
      - ./train_data/cls/cls_gt_train.txt
    transforms:
      - DecodeImage: # load image
          img_mode: BGR
          channel_first: False
      - ClsLabelEncode: # Class handling label
      - BaseDataAugmentation:
      - RandAugment:
      - ClsResizeImg:
          image_shape: [3, 30, 300]
      - KeepKeys:
          keep_keys: ['image', 'label'] # dataloader will return list in this order
  loader:
    shuffle: True
    batch_size_per_card: 1
    drop_last: True
    num_workers: 0

Eval:
  dataset:
    name: SimpleDataSet
    data_dir: ./train_data/cls/train
    label_file_list:
      - ./train_data/cls/cls_gt_train.txt
    transforms:
      - DecodeImage: # load image
          img_mode: BGR
          channel_first: False
      - ClsLabelEncode: # Class handling label
      - ClsResizeImg:
          image_shape: [3, 30, 300]
      - KeepKeys:
          keep_keys: ['image', 'label'] # dataloader will return list in this order
  loader:
    shuffle: False
    drop_last: False
    batch_size_per_card: 1
    num_workers: 0

##这是我的报错信息

(paddleOCR) D:\PaddleOCR-release-2.7.1>python tools/train.py -c configs/cls/cls_mv3.yml
[2024/08/12 13:26:44] ppocr INFO: Architecture :
[2024/08/12 13:26:44] ppocr INFO:     Backbone :
[2024/08/12 13:26:44] ppocr INFO:         model_name : small
[2024/08/12 13:26:44] ppocr INFO:         name : MobileNetV3
[2024/08/12 13:26:44] ppocr INFO:         scale : 0.35
[2024/08/12 13:26:44] ppocr INFO:     Head :
[2024/08/12 13:26:44] ppocr INFO:         class_dim : 2
[2024/08/12 13:26:44] ppocr INFO:         name : ClsHead
[2024/08/12 13:26:44] ppocr INFO:     Neck : None
[2024/08/12 13:26:44] ppocr INFO:     Transform : None
[2024/08/12 13:26:44] ppocr INFO:     algorithm : CLS
[2024/08/12 13:26:44] ppocr INFO:     model_type : cls
[2024/08/12 13:26:44] ppocr INFO: Eval :
[2024/08/12 13:26:44] ppocr INFO:     dataset :
[2024/08/12 13:26:44] ppocr INFO:         data_dir : ./train_data/cls/train
[2024/08/12 13:26:44] ppocr INFO:         label_file_list : ['./train_data/cls/cls_gt_train.txt']
[2024/08/12 13:26:44] ppocr INFO:         name : SimpleDataSet
[2024/08/12 13:26:44] ppocr INFO:         transforms :
[2024/08/12 13:26:44] ppocr INFO:             DecodeImage :
[2024/08/12 13:26:44] ppocr INFO:                 channel_first : False
[2024/08/12 13:26:44] ppocr INFO:                 img_mode : BGR
[2024/08/12 13:26:44] ppocr INFO:             ClsLabelEncode : None
[2024/08/12 13:26:44] ppocr INFO:             ClsResizeImg :
[2024/08/12 13:26:44] ppocr INFO:                 image_shape : [3, 30, 300]
[2024/08/12 13:26:44] ppocr INFO:             KeepKeys :
[2024/08/12 13:26:44] ppocr INFO:                 keep_keys : ['image', 'label']
[2024/08/12 13:26:44] ppocr INFO:     loader :
[2024/08/12 13:26:44] ppocr INFO:         batch_size_per_card : 1
[2024/08/12 13:26:44] ppocr INFO:         drop_last : False
[2024/08/12 13:26:44] ppocr INFO:         num_workers : 0
[2024/08/12 13:26:44] ppocr INFO:         shuffle : False
[2024/08/12 13:26:44] ppocr INFO: Global :
[2024/08/12 13:26:44] ppocr INFO:     cal_metric_during_train : True
[2024/08/12 13:26:44] ppocr INFO:     checkpoints : None
[2024/08/12 13:26:44] ppocr INFO:     distributed : False
[2024/08/12 13:26:44] ppocr INFO:     epoch_num : 100
[2024/08/12 13:26:44] ppocr INFO:     eval_batch_step : [0, 1000]
[2024/08/12 13:26:44] ppocr INFO:     infer_img : doc/imgs_words_en/word_10.png
[2024/08/12 13:26:44] ppocr INFO:     label_list : ['0', '180']
[2024/08/12 13:26:44] ppocr INFO:     log_smooth_window : 20
[2024/08/12 13:26:44] ppocr INFO:     pretrained_model : None
[2024/08/12 13:26:44] ppocr INFO:     print_batch_step : 10
[2024/08/12 13:26:44] ppocr INFO:     save_epoch_step : 3
[2024/08/12 13:26:44] ppocr INFO:     save_inference_dir : None
[2024/08/12 13:26:44] ppocr INFO:     save_model_dir : ./output/cls/mv3/
[2024/08/12 13:26:44] ppocr INFO:     use_gpu : True
[2024/08/12 13:26:44] ppocr INFO:     use_visualdl : False
[2024/08/12 13:26:44] ppocr INFO: Loss :
[2024/08/12 13:26:44] ppocr INFO:     name : ClsLoss
[2024/08/12 13:26:44] ppocr INFO: Metric :
[2024/08/12 13:26:44] ppocr INFO:     main_indicator : acc
[2024/08/12 13:26:44] ppocr INFO:     name : ClsMetric
[2024/08/12 13:26:44] ppocr INFO: Optimizer :
[2024/08/12 13:26:44] ppocr INFO:     beta1 : 0.9
[2024/08/12 13:26:44] ppocr INFO:     beta2 : 0.999
[2024/08/12 13:26:44] ppocr INFO:     lr :
[2024/08/12 13:26:44] ppocr INFO:         learning_rate : 0.001
[2024/08/12 13:26:44] ppocr INFO:         name : Cosine
[2024/08/12 13:26:44] ppocr INFO:     name : Adam
[2024/08/12 13:26:44] ppocr INFO:     regularizer :
[2024/08/12 13:26:44] ppocr INFO:         factor : 0
[2024/08/12 13:26:44] ppocr INFO:         name : L2
[2024/08/12 13:26:44] ppocr INFO: PostProcess :
[2024/08/12 13:26:44] ppocr INFO:     name : ClsPostProcess
[2024/08/12 13:26:44] ppocr INFO: Train :
[2024/08/12 13:26:44] ppocr INFO:     dataset :
[2024/08/12 13:26:44] ppocr INFO:         data_dir : ./train_data/cls/train
[2024/08/12 13:26:44] ppocr INFO:         label_file_list : ['./train_data/cls/cls_gt_train.txt']
[2024/08/12 13:26:44] ppocr INFO:         name : SimpleDataSet
[2024/08/12 13:26:44] ppocr INFO:         transforms :
[2024/08/12 13:26:44] ppocr INFO:             DecodeImage :
[2024/08/12 13:26:44] ppocr INFO:                 channel_first : False
[2024/08/12 13:26:44] ppocr INFO:                 img_mode : BGR
[2024/08/12 13:26:44] ppocr INFO:             ClsLabelEncode : None
[2024/08/12 13:26:44] ppocr INFO:             BaseDataAugmentation : None
[2024/08/12 13:26:44] ppocr INFO:             RandAugment : None
[2024/08/12 13:26:44] ppocr INFO:             ClsResizeImg :
[2024/08/12 13:26:44] ppocr INFO:                 image_shape : [3, 30, 300]
[2024/08/12 13:26:44] ppocr INFO:             KeepKeys :
[2024/08/12 13:26:44] ppocr INFO:                 keep_keys : ['image', 'label']
[2024/08/12 13:26:44] ppocr INFO:     loader :
[2024/08/12 13:26:44] ppocr INFO:         batch_size_per_card : 1
[2024/08/12 13:26:44] ppocr INFO:         drop_last : True
[2024/08/12 13:26:44] ppocr INFO:         num_workers : 0
[2024/08/12 13:26:44] ppocr INFO:         shuffle : True
[2024/08/12 13:26:44] ppocr INFO: profiler_options : None
[2024/08/12 13:26:44] ppocr INFO: train with paddle 2.6.1 and device Place(gpu:0)
[2024/08/12 13:26:44] ppocr INFO: Initialize indexs of datasets:['./train_data/cls/cls_gt_train.txt']
list index out of range
[2024/08/12 13:26:44] ppocr INFO: Initialize indexs of datasets:['./train_data/cls/cls_gt_train.txt']
W0812 13:26:44.671368   520 gpu_resources.cc:119] Please NOTE: device: 0, GPU Compute Capability: 6.1, Driver API Version: 12.6, Runtime API Version: 11.7
W0812 13:26:44.674342   520 gpu_resources.cc:164] device: 0, cuDNN Version: 8.9.
[2024/08/12 13:26:45] ppocr INFO: train dataloader has 12362 iters
[2024/08/12 13:26:45] ppocr INFO: valid dataloader has 12362 iters
[2024/08/12 13:26:45] ppocr INFO: train from scratch
[2024/08/12 13:26:45] ppocr INFO: During the training process, after the 0th iteration, an evaluation is run every 1000 iterations
[2024/08/12 13:26:46] ppocr ERROR: When parsing line cam#0-NG(OCR)-20240629-195141-478_crop_0.png       0
, error happened with msg: Traceback (most recent call last):
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 157, in __getitem__
    data['image'] = img
RecursionError: maximum recursion depth exceeded while calling a Python object

Fatal Python error: Cannot recover from stack overflow.
Python runtime state: initialized

Current thread 0x000012b4 (most recent call first):
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 157 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  File "D:\PaddleOCR-release-2.7.1\ppocr\data\simple_dataset.py", line 169 in __getitem__
  ...

Thread 0x00000208 (most recent call first):
  File "D:\ProgramData\anaconda3\envs\paddleOCR\lib\site-packages\paddle\io\dataloader\dataloader_iter.py", line 291 in __next__
  File "D:\PaddleOCR-release-2.7.1\tools\program.py", line 272 in train
  File "tools/train.py", line 200 in main
  File "tools/train.py", line 229 in <module>

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
檀越@新空间 2024-08-12 13:56
关注
下午好🌅🌅🌅
本答案参考ChatGPT-3.5

训练过程中出现错误的原因可能是由于模型没有正确初始化，也可能是数据格式不正确。为了解决这个问题，你可以尝试以下几种解决方法：

检查你的模型和数据加载器是否正确。确保它们的名称和路径与示例中的内容匹配。

model_path = "./output/cls/mv3/"

models目录下应该有包含这个路径的文件，如MobileNetV3.h5或small.h5。检查数据集和标签文件的路径是否正确，并确认它们的内容符合预期。

确保你的labels.txt文件中包含了所有的类标签（0到180）。

在你的代码中使用decode_image函数来加载图像。例如：

img = decode_image(img_path)

确保你在调用decode_image函数之前已经加载了对应的图片文件。

使用base_data_augmentation模块来处理数据。例如：

data augumentation = base_data_augmentation() # ... augmented_data = augumentation(data) # ...

注意，你需要将base_data_augmentation()函数替换为你自己的数据预处理函数。

使用resize_img模块对图像进行缩放。例如：

resize_img(img_path, new_shape=(30, 300))

请将new_shape参数设置为(30, 300)。

使用keep_keys参数指定decode_image函数返回的数据中的保留键。例如：

keep_keys = ['image', 'label'] decoded_data = decode_image(img_path, keep_keys=keep_keys)

在训练模型时，你需要使用这些数据，而不是原始数据。

如果上述方法都不能解决问题，那么你可能需要进一步调试你的代码，看看是否有其他变量的影响。或者，如果你使用的是paddleOCR库，你可能需要查看相关文档以获取更多的帮助。

希望这些建议能对你有所帮助！如果还有任何疑问，欢迎随时向我提问。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

PaddleOCR中英文文字识别实战指南
2025-12-16 13:35

笨爪的博客本文深入解析PaddleOCR在中英文文字识别中的应用，涵盖安装配置、模型测试、常见问题处理及优化技巧。通过实际案例展示了CPU与GPU环境下的部署差异，并针对方向分类、多语言支持、模型微调等关键问题提供了解决方案...
终极指南：如何快速实现PaddleOCR到ONNX的模型转换与跨平台部署
2026-01-07 01:46

邱敬镇的博客在当今AI应用快速发展的时代，ONNX OCR模型转换技术为开发者提供了全新的跨平台部署解决方案。本文将带你从零开始，掌握PaddleOCR转ONNX的核心技巧，实现轻量级OCR推理，轻松完成多平台OCR部署。 ## 为什么选择ONNX...
PaddlePaddle/PaddleOCR 中英文文字识别
2021-09-06 18:36

唠叨大头的博客 GitHub地址：https://github.com/PaddlePaddle/PaddleOCR 1.QUICK INSTALLATION：https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.2/doc/doc_en/installation_en.md 2.Quick start of Chinese OCR ...
PaddleOCR #使用PaddleOCR进行光学字符识别（PP-OCR文本检测识别）
2023-06-19 19:09

有时有味的博客 PaddleOCR 是一个 OCR 框架或工具包，它提供多语言实用的 OCR 工具，帮助用户在几行代码中应用和训练不同的模型。PaddleOCR 提供了一系列高质量的预训练模型。这包含三种类型的模型，使 OCR 高度准确并接近商业产品...
PaddleOCR跨平台教程：Mac用户也能玩转AI文字识别
2026-01-15 00:40

EmeraldTiger56的博客本文介绍了如何在星图GPU平台自动化部署PaddlePaddle-v3.3镜像，快速搭建基于PaddleOCR的AI文字识别服务。用户无需复杂配置，即可在Mac等设备上通过浏览器上传图片、提取文字，适用于文档数字化、设计稿内容抓取等...
PaddlePaddle模型库详解：100+预训练模型免费调用指南
2025-12-27 01:17

念区的博客百度飞桨提供100多个工业级预训练模型，覆盖OCR、NLP、检测等场景，专为中文任务优化，支持快速微调与轻量化部署。几行代码即可调用ERNIE、PP-OCR等模型，适配国产芯片，助力AI高效落地。
性能对比实测：HunyuanOCR vs PaddleOCR 谁更胜一筹？
2026-01-03 15:09

鱼总美签的博客 HunyuanOCR采用端到端多模态大模型架构，通过统一模型直接生成结构化文本，具备上下文感知和Prompt驱动能力，在多语言、复杂版面场景下表现更优；PaddleOCR延续检测+识别的级联模式，模块化强、可定制性高，适合精细...
PaddleOCR-VL保姆级教程：高效文档解析模型部署与性能优化
2026-01-18 00:56

心言星愿的博客本文介绍了基于星图GPU平台自动化部署PaddleOCR-VL-WEB镜像的完整流程。该平台支持一键启动文档解析服务，实现高效模型微调与AI应用开发。PaddleOCR-VL-WEB可广泛应用于多语言文档的结构化提取，如PDF、扫描件中的...
ONNX格式导出功能：跨平台互操作性的增强方向
2026-01-03 17:36

亜恵恵阿由的博客 ONNX通过统一的中间表示打破框架与硬件壁垒，让PyTorch等训练模型可高效运行于CPU、GPU、浏览器及移动端，支持一次导出、多端复用。结合优化工具与推理引擎，显著提升部署效率与一致性，成为AI工程化落地的关键基础...
如何高效处理复杂文档？PaddleOCR-VL-WEB大模型镜像全解析
2026-01-17 02:31

瓷tun的博客本文介绍了基于星图GPU平台自动化部署PaddleOCR-VL-WEB镜像的完整方案。该镜像集成视觉-语言大模型，支持多语言文档的高精度解析，可高效实现表格、公式与文本的端到端识别。典型应用于金融票据识别、学术文献数字化...
PaddleOCR版本选择困难？云端同时测试3个版本
2026-01-19 00:25

SapphireFox37的博客本文介绍了如何在星图GPU平台自动化部署PaddlePaddle-v3.3镜像，实现PaddleOCR多个版本的并行测试与效果对比。通过该平台，开发者可快速启动云端实例，高效完成模型微调、参数调优及不同场景下的OCR性能评估，显著...
Rembg模型Docker部署：跨平台解决方案
2026-01-12 10:38

般若之镜的博客本文系统介绍了Rembg 模型的 Docker 化部署...跨平台易部署：Docker 一键启动，支持 CPU/GPU 环境；双模式交互：既提供可视化 WebUI，也开放标准化 API 接口；工业级适用性：广泛应用于电商、设计、AI 内容生成等领域。
[PaddleOCR]文本图像矫正模块实战：从原理到高效部署
2025-09-05 03:51

失眠邮局的博客本文详细解析了PaddleOCR文本图像矫正模块的核心原理与实战部署。针对OCR识别因图像倾斜、透视变形导致的准确率下降问题，该模块基于UVDoc模型，通过检测文档角点并进行单应性变换，有效矫正图像。文章提供了从快速...
PaddlePaddle镜像如何实现模型灰度路由？基于用户特征分流
2025-12-27 00:55

八大山狗的博客通过PaddlePaddle镜像结合用户特征实现模型灰度发布，支持基于user_id哈希、地域、设备等维度的精准分流，保障AI服务迭代稳定性。利用容器化部署与网关路由，实现多版本模型并行运行、动态策略调整与全链路监控，...
PaddleOCR-json：高效OCR工具助力多场景文字识别应用
2025-12-15 05:34

鲍瑜晟Kirby的博客 PaddleOCR-json作为一款基于深度学习框架的离线文字识别工具，通过C++原生编译实现了高性能的本地化处理能力，为开发者提供了安全可靠的OCR解决方案。该工具支持多种编程语言集成，能够有效解决企业级应用中对于数据...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月12日

训练paddleOCR文字方向模型的时候发生错误，如何解决？

问题遇到的现象和发生背景

操作环境、软件版本等信息

尝试过的解决方法

我想要达到的结果

1条回答 默认 最新

问题事件

1条回答默认最新