PaddleOCR训练时如何添加自定义新字？

在使用PaddleOCR进行训练时，如何添加自定义新字是一个常见问题。当需要识别的字符不在默认字符集内时，必须对字符集进行扩展。首先，需修改配置文件中的字符列表，将新字加入到`ppocr/utils/ppocr_keys.py`或自定义的字符文件中，并确保字符顺序正确且无重复。其次，在数据标注文件中包含这些新字，以生成训练所需的标签数据。最后，重新准备训练数据并调整模型参数，特别是输入层的字符维度大小，使其与新的字符集匹配。若忽略上述步骤，可能导致模型无法正确学习新增字符，影响最终识别效果。如何准确地完成这些操作是用户在定制化场景下需重点解决的技术挑战。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
The Smurf 2025-06-17 20:55
关注
1. 问题概述：PaddleOCR字符集扩展的基本概念

在使用PaddleOCR进行训练时，如果需要识别的字符不在默认字符集内，则必须对字符集进行扩展。这是许多用户在定制化场景下遇到的技术挑战。

默认字符集位于`ppocr/utils/ppocr_keys.py`文件中。
新增字符需正确添加到该文件或自定义字符文件中。
确保字符顺序正确且无重复是关键步骤。

例如，假设我们希望模型能够识别“@”符号，而该符号不在默认字符集中，则需要将“@”添加到字符列表中。

2. 技术实现：字符集扩展的具体操作

以下是完成字符集扩展的关键步骤：

修改字符列表：打开`ppocr/utils/ppocr_keys.py`文件，找到默认字符集，并将新字添加到列表末尾。
更新数据标注文件：确保训练数据中标注包含新增字符。
调整模型参数：重新准备训练数据并调整输入层的字符维度大小。

以下是一个示例代码片段，展示如何修改字符列表：

# 打开 ppocr/utils/ppocr_keys.py 文件 # 修改默认字符集 DEFAULT_CHAR_SET = [ "0", "1", "2", "3", "4", "5", "6", "7", "8", "9", "a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t", "u", "v", "w", "x", "y", "z", "@", # 新增字符 ]

3. 数据准备与模型调整

为了确保模型能够正确学习新增字符，还需要完成以下步骤：

步骤描述
1. 更新数据标注在标注文件（如CSV或TXT）中包含新增字符的标签。
2. 调整模型参数修改配置文件中的字符维度大小，使其与新的字符集匹配。

例如，如果新增了5个字符，则输入层的字符维度大小应从原本的94增加到99。

4. 流程图：字符集扩展的整体流程

以下是字符集扩展的整体流程图：

graph TD; A[开始] --> B[修改字符列表]; B --> C[更新数据标注文件]; C --> D[调整模型参数]; D --> E[重新训练模型];

通过上述流程，可以确保新增字符被正确纳入模型的学习范围。

5. 常见问题与解决方案

在实际操作中，可能会遇到以下问题：

问题1：新增字符未被正确识别。
解决方案：检查字符列表是否正确添加，并确认标注文件和模型参数已同步更新。
问题2：模型训练效果不佳。
解决方案：增加包含新增字符的数据量，并调整超参数以优化模型性能。

此外，还需注意字符顺序的正确性，避免因重复字符导致的冲突。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

步骤	描述
1. 更新数据标注	在标注文件（如CSV或TXT）中包含新增字符的标签。
2. 调整模型参数	修改配置文件中的字符维度大小，使其与新的字符集匹配。

报告相同问题？

关注问题

C#基于百度飞浆PaddleOCR文字识别源码
2024-06-11 14:02

C#是一种广泛使用的编程语言，尤其在Windows平台上，用于开发桌面应用、游戏、服务器端软件等。为了在C#项目中调用PaddleOCR，我们需要使用Python.NET库，这是一个允许C#代码直接调用Python API的桥梁。通过这个库，...
PaddleOCR-develop.zip
2021-02-22 16:52

例如，如果需要处理特定字体或者语言的文字，可以使用PaddleOCR提供的训练工具，结合自定义数据集进行微调，优化模型性能。 2. **接口扩展**：PaddleOCR提供了一系列API供开发者调用，进行文字检测和识别。二次开发...
基于PaddleOCR重构，并且脱离PaddlePaddle深度学习训练框架的OCR.zip
2024-03-28 20:52

同时，"脱离PaddlePaddle深度学习训练框架"则意味着该OCR系统不再依赖于PaddlePaddle作为其训练环境，可能转而使用其他的深度学习框架，如TensorFlow、PyTorch等，或者是自定义的训练方案。在“人工智能毕业设计&...
PaddleOCR-release-2.7
2023-09-06 09:00

使用PaddleOCR时，首先需要按照文档的指引安装必要的依赖，然后通过命令行或Python代码调用相应的接口，传入待处理的图像，即可获得识别结果。总结，PaddleOCR-release-2.7是一个强大的OCR工具，基于Python编程，...
Python库 | paddleocr-sabhi-0.0.13.tar.gz
2022-03-07 03:21

标签包括"python 开发语言后端 Python库"，这表明PaddleOCR是用Python编程语言编写的，主要针对后端开发，即服务器端应用。作为Python库，它允许开发者通过导入库的方式在他们的Python项目中集成OCR功能。在压缩...
python撰写一个图像文字识别OCR工具
2022-04-27 00:46

标题中的“python撰写一个图像文字识别OCR工具”指的是利用Python编程语言开发的一种光学字符识别（Optical Character Recognition，OCR）应用程序。OCR技术主要用于自动识别图像中的文字，将图像中的文本转换为可...
5分钟上手！PaddleOCR自动化脚本：从单张图片到万级文档的批量处理指南
2025-08-30 04:28

邓尤楚的博客本文将带你用PaddleOCR构建一套自动化批量处理流水线，无需复杂编程基础，即可实现从单张图片到数万份文档的高效文字提取。读完本文，你将掌握：批量识别脚本编写、多格式文件处理、结果结构化存储、错误重试机制...
全网最新免费开源的ocr文字识别开源项目盘点整理，附项目开源地址，支持离线部署使用，支持多种语言识别和API调用以及第三方集成，支持各种证件、发票、通用模型识别，支持复杂文本、各种图片、文档、长文本等
2024-06-19 17:58

代码讲故事的博客全网最新免费开源的ocr文字识别开源项目盘点整理，附项目开源地址，支持离线部署使用，支持多种语言识别和API调用以及第三方集成，支持各种证件、发票、通用模型识别，支持复杂文本、各种图片、文档、长文本等。
5分钟上手！PaddleOCR CLI命令行工具：从安装到批量文字识别全攻略
2025-08-30 01:03

gitblog_00881的博客本文将带你零基础掌握PaddleOCR命令行工具（Command Line Interface，命令行界面），无需编程即可实现图片文字提取、表格识别甚至多语言转换，让OCR处理像使用`ls`命令一样简单。读完本文你将学会： - 3种环境安装...
python百度paddle表格文字识别生成excel
2022-05-19 10:59

标题中的“python百度paddle表格文字识别生成excel”是一个关于使用Python编程语言，结合百度的PaddleOCR（PaddlePaddle深度学习框架）进行表格文字识别，并将识别结果转化为Excel文件的项目。这个项目旨在帮助用户...
PaddleOCR文字识别使用
2021-01-15 10:46

非常道的博客 PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力使用者训练出更好的模型，并应用落地。注意 PaddleOCR同时支持动态图与静态图两种编程范式动态图版本：dygraph分支（默认），需将paddle版本升级至2.0...
最新OCR开源神器来了！
2021-09-07 22:00

Datawhale的博客 Datawhale开源开源方向：OCR开源项目01导读OCR方向的工程师，之前一定听说过PaddleOCR这个项目，其主要推荐的PP-OCR算法更是被国内外企业开发者广泛应用，短短半年...
PaddleOCR-json：高效OCR工具助力多场景文字识别应用
2025-12-15 05:34

鲍瑜晟Kirby的博客在当今数字化进程中，图像文字识别技术已成为众多应用场景的核心需求。然而，传统的云端OCR服务面临着数据隐私泄露、...该工具支持多种编程语言集成，能够有效解决企业级应用中对于数据安全和处理效率的双重需求。 [!
利用Python开发图像文字识别OCR工具
2025-08-18 07:59

叶宇霖的博客 PyQt是一个用于创建图形用户界面的跨平台工具集，它是Python编程语言与Qt库的结合体。Qt本身是一个强大的C++库，广泛应用于软件开发中，用以构建具有吸引力的界面。而PyQt允许开发者利用Python的简洁性快速地构建GUI...
预训练时代微调新范式，高性能加速2800%，NLPer赶紧看过来！
2021-10-12 15:00

AI科技大本营的博客导读PaddleNLP 是兼具科研学习和产业实践能力的 Python NLP 工具包，提供中文领域丰富的预训练模型和部署工具，被高校、企业开发者广泛应用。近日，PaddleNLP v2.1...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月17日

PaddleOCR训练时如何添加自定义新字？

1条回答 默认 最新

1. 问题概述：PaddleOCR字符集扩展的基本概念

2. 技术实现：字符集扩展的具体操作

3. 数据准备与模型调整

4. 流程图：字符集扩展的整体流程

5. 常见问题与解决方案

问题事件

1条回答默认最新