在文字识别过程中,我识别完成多张书的图片,希望通过查找关键字来找到对应在第几页。例如:10张图片分别对应书中1到10页。经过文字识别生成了txt文件,关键字“项目”在第九页。我想搜索关键字“项目”,然后可以返回页码“9”如何实现呢?
最好用Python3+
百度智能云文字识别
pycharm
难点是无法找到本页页数,同时难以判断它是否是页数。而且,实际应用过程中页码不会有顺序,所以得用图片上的页码,但页码难以识别出来。目前思路是:用图片识别后,用区域识别出页码,然后搜索关键字后,返回对应页码。想问具体如何实现或有更好思路吗
Python如何在对书的图片文字识别后自动返回页数
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
3条回答 默认 最新
- CSDN专家-HGJ 2021-08-13 11:07关注
可以借助os模块用字符串判断方式来获取结果,参考代码:
import os for i,fn in enumerate(os.listdir('txts')): with open(os.path.join(os.getcwd(),'txts',fn),'r',encoding='utf-8') as f: if '项目' in f.read(): print(i+1)
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥30 Matlab打开默认名称带有/的光谱数据
- ¥50 easyExcel模板 动态单元格合并列
- ¥15 res.rows如何取值使用
- ¥15 在odoo17开发环境中,怎么实现库存管理系统,或独立模块设计与AGV小车对接?开发方面应如何设计和开发?请详细解释MES或WMS在与AGV小车对接时需完成的设计和开发
- ¥15 CSP算法实现EEG特征提取,哪一步错了?
- ¥15 游戏盾如何溯源服务器真实ip?需要30个字。后面的字是凑数的
- ¥15 vue3前端取消收藏的不会引用collectId
- ¥15 delphi7 HMAC_SHA256方式加密
- ¥15 关于#qt#的问题:我想实现qcustomplot完成坐标轴
- ¥15 下列c语言代码为何输出了多余的空格