程序员Peter 2025-02-13 16:57 采纳率: 0%
浏览 46

PaddleOCR手写体和印刷体检测和识别


在数据标注和格式适配过程中遇到以下问题,恳请指导:
一、检测任务数据格式问题
官方文档要求格式:
![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/ef61a281fd084615a22e6db77dc1ac7a.jpeg "#left")

疑问点:
1.格式强制性问题:
是否必须严格使用JSON格式?若自定义格式(如下文建议)是否可行?
2.手写体与印刷体的区分标注:
如何在JSON标注中明确区分印刷体(printed)和手写体(handwriting)?是否需要在标注字段中添加额外参数(如"type": "printed")?
自定义格式设想:
图像路径 x1,y1,x2,y1,x2,y2,x1,y2,标签类型 ...  
示例:  
images/0_0/lhr_0_1000_01184616.jpg 0.58,0.72,0.86,0.72,0.86,0.96,0.58,0.96,printed ...  
二、识别任务多文本标注问题
官方文档示例:

![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/114980407b5242d0a39e53722e2f39cf.jpeg "#left")

单图单标签格式:
图像路径 文本标签  
示例:  
test_images/img_1.jpg "воссоздать"  
实际需求:
一张图片中包含多个俄语单词,需同时识别多个文本
疑问点:
1.多标签标注方式:
是否支持单图多标签标注?例如:
images/0_0/lhr_0_1000_01184616.jpg    воссоздать пивной Винничек коммунизм
若不支持,是否需要通过切割图片将每个单词单独处理?
补充说明:
数据集中同时包含手写体和印刷体俄语文本,需确保标注格式能兼容类型区分。
作为初学者,对PP-v4的数据处理逻辑尚不熟悉,若问题表述不够清晰,还请海涵!
期待您的专业解答,感谢!
  • 写回答

4条回答 默认 最新

  • 阿里嘎多学长 2025-02-13 16:57
    关注

    阿里嘎多学长整理AIGC生成,因移动端显示问题导致当前答案未能完全显示,请使用PC端查看更加详细的解答过程

    PaddleOCR手写体和印刷体检测和识别

    你遇到的问题是关于PaddleOCR检测任务数据格式的问题。官方文档要求检测任务数据格式为JSON格式,包含以下信息:

    • image: 图像数据
    • text: 文本信息
    • label: 标签信息

    在数据标注和格式适配过程中,你可能需要将图像数据和对应的文本信息和标签信息组合成JSON格式的数据。

    例如:

    {
        "image": "path/to/image.jpg",
        "text": "手写体识别",
        "label": "handwritten"
    }
    

    在PaddleOCR中,你可以使用paddleocr工具来将图像数据转换为检测任务数据格式。例如:

    import paddleocr
    
    # 读取图像数据
    image = paddleocr.read_image("path/to/image.jpg")
    
    # 将图像数据转换为检测任务数据格式
    data = paddleocr.convert_to_detection_data(image, "handwritten")
    
    # 将数据保存为JSON文件
    with open("data.json", "w") as f:
        json.dump(data, f)
    

    这只是一个简单的示例代码,实际情况中你可能需要根据你的需求和数据格式进行修改。

    如果你遇到其他问题或需要更多帮助,请随时问我。

    评论

报告相同问题?

问题事件

  • 创建了问题 2月13日