zhucehaoduo 2022-08-21 12:58 采纳率: 50%
浏览 61
已结题

PaddleOCR 的结果怎么转换成Word文档?

产生的数据如下(CSDN害的去掉了左边的两个大括号),输出结果是一个list,每个item包含了文本框,文字和识别置信度:
[47.0, 35.0], [306.0, 35.0], [306.0, 90.0], [47.0, 90.0]], ('免夹免拉', 0.989071249961853)]
[52.0, 109.0], [276.0, 109.0], [276.0, 130.0], [52.0, 130.0]], ('操作简单居家可做', 0.988811731338501)]
[52.0, 146.0], [277.0, 146.0], [277.0, 167.0], [52.0, 167.0]], ('温和配方健康直发', 0.9917734861373901)]
[140.0, 441.0], [186.0, 441.0], [186.0, 455.0], [140.0, 455.0]], ('STRAIT', 0.9612524509429932)]
[113.0, 464.0], [208.0, 453.0], [213.0, 494.0], [118.0, 505.0]], ('glatt', 0.9871892929077148)]
[31.0, 561.0], [52.0, 560.0], [56.0, 642.0], [35.0, 643.0]], ('219PLUS', 0.7543826103210449)]
[609.0, 586.0], [774.0, 586.0], [774.0, 631.0], [609.0, 631.0]], ('活动价:', 0.9964019060134888)]
[594.0, 639.0], [799.0, 645.0], [794.0, 798.0], [589.0, 792.0]], ('45', 0.9980571269989014)]
[581.0, 652.0], [603.0, 652.0], [603.0, 680.0], [581.0, 680.0]], ('?', 0.8542420268058777)]
[143.0, 680.0], [473.0, 680.0], [473.0, 711.0], [143.0, 711.0]], ('下单赠送全套工具', 0.9827134609222412)]
[12.0, 749.0], [545.0, 747.0], [545.0, 781.0], [12.0, 783.0]], ('一梳就直免拉免夹家用直发膏', 0.9552955627441406)]

怎么把它们按照原图的顺序和位置写到Word文件里去,
下面的简单的添加不行,必须考虑将同一行的文字合并,并按原图的高低位置顺序写到docx

result = ocr.ocr(img_path, cls=True)

#resulttxtpath = open(".\result.txt",'w+')
doc = Document()

for line in result:

print(line)

print(line[1][0])

resulttxtpath.writelines(line[1][0]+"\n")

doc.add_paragraph(line[1][0])

引入PIL库中的模块

  • 写回答

1条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-08-22 06:03
    关注
    这篇文章:PaddleOCR详细实现文档教程 也许能够解决你的问题,你可以看下
    评论

    报告相同问题?

    问题事件

    • 系统已结题 8月29日
    • 创建了问题 8月21日

    悬赏问题

    • ¥500 抖音主页视频预存加载卡bug
    • ¥15 用汇编语言编写51单片机,定时闹钟程序
    • ¥20 关于TRPD(波形特征)局部放电特征提取
    • ¥15 C语言快速排序函数纠错
    • ¥15 C#的一个应用程序书写
    • ¥65 页面调接口时加载卡住不响应
    • ¥35 用C语言解决编程问题
    • ¥15 unity硬件连接与使用
    • ¥15 鱼缸加热棒的数据分析或者实际案例也行
    • ¥15 postgresql11安装完成后,pgadmin无法启动