m0_66613654 2022-02-07 17:12 采纳率: 100%
浏览 62
已结题

python提取文档中指定范围文字

入门新手,上百页的文档txt或pdf怎么快速提取。如'a'后面的n个字符、a、b之间的字符。用什么方法,速度快?

  • 写回答

5条回答 默认 最新

  • 老师我作业忘带了 2022年度博客之星人工智能领域TOP 2 2022-02-08 03:46
    关注

    这个只写一下个人思路,我知识有限,我的办法是:既然你提到你的文档数据量很大,那你可以每次只读取一部分,如果这部分出现了”a“,那就从这个”a“作为起点读取。因为我觉得你描述的问题不是你不会读取,而是因为你觉得一次性把一堆内容加载读取到内存中不太好。至于效率问题python就多用用封装好了东西吧比如正则,毕竟西语言写的比python切片应该快很多。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(4条)

报告相同问题?

问题事件

  • 系统已结题 2月16日
  • 已采纳回答 2月8日
  • 修改了问题 2月7日
  • 创建了问题 2月7日

悬赏问题

  • ¥30 vmware exsi重置后登不上
  • ¥15 易盾点选的cb参数怎么解啊
  • ¥15 MATLAB运行显示错误,如何解决?
  • ¥15 c++头文件不能识别CDialog
  • ¥15 Excel发现不可读取的内容
  • ¥15 关于#stm32#的问题:CANOpen的PDO同步传输问题
  • ¥20 yolov5自定义Prune报错,如何解决?
  • ¥15 电磁场的matlab仿真
  • ¥15 mars2d在vue3中的引入问题
  • ¥50 h5唤醒支付宝并跳转至向小荷包转账界面