升鵬 2021-08-13 10:44 采纳率: 50%
浏览 81
已结题

Python如何在对书的图片文字识别后自动返回页数

在文字识别过程中,我识别完成多张书的图片,希望通过查找关键字来找到对应在第几页。例如:10张图片分别对应书中1到10页。经过文字识别生成了txt文件,关键字“项目”在第九页。我想搜索关键字“项目”,然后可以返回页码“9”如何实现呢?
最好用Python3+
百度智能云文字识别
pycharm
难点是无法找到本页页数,同时难以判断它是否是页数。而且,实际应用过程中页码不会有顺序,所以得用图片上的页码,但页码难以识别出来。目前思路是:用图片识别后,用区域识别出页码,然后搜索关键字后,返回对应页码。想问具体如何实现或有更好思路吗

  • 写回答

3条回答 默认 最新

  • CSDN专家-HGJ 2021-08-13 11:07
    关注

    可以借助os模块用字符串判断方式来获取结果,参考代码:

    import os 
    
    for i,fn in enumerate(os.listdir('txts')):
        with open(os.path.join(os.getcwd(),'txts',fn),'r',encoding='utf-8') as f:
            if '项目' in f.read():
                print(i+1)
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 12月6日
  • 已采纳回答 11月28日
  • 修改了问题 8月13日
  • 修改了问题 8月13日
  • 展开全部

悬赏问题

  • ¥30 关于用python写支付宝扫码付异步通知收不到的问题
  • ¥50 vue组件中无法正确接收并处理axios请求
  • ¥15 隐藏系统界面pdf的打印、下载按钮
  • ¥15 MATLAB联合adams仿真卡死如何解决(代码模型无问题)
  • ¥15 基于pso参数优化的LightGBM分类模型
  • ¥15 安装Paddleocr时报错无法解决
  • ¥15 python中transformers可以正常下载,但是没有办法使用pipeline
  • ¥50 分布式追踪trace异常问题
  • ¥15 人在外地出差,速帮一点点
  • ¥15 如何使用canvas在图片上进行如下的标注,以下代码不起作用,如何修改