Python或c#实现图片格式的PDF转txt

Python或C#有什么办法能比较好使将图片格式的pdf文件转为txt，同时需要能带格式的
地识别图片中的表格

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2019-12-09 16:10
关注
可以分为2步，首先将图片提取出来，然后进行文字识别，至于表格，因为你是图片，所以只能转换成文本，然后再根据一定规则去还原
前者可以用pdfminer，后者文字识别可以用pytesseract

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python 实现C# 代码 c# python
2022-10-25 21:28

回答 3 已采纳可以啦 import base64 import array class Program: def VinEncrypt(self, data): data = da
python爬虫图片转pdf python
2022-09-01 00:03

回答 1 已采纳这篇文章：Python 图片转pdf 也许有你想要的答案，你可以看看
Python中如何将数组类型的图片转换成BASE64格式 python 人工智能计算机视觉
2022-05-23 19:54

回答 1 已采纳仅供参考： image = imagedata.reshape((height, width, 3)) #3 is Actually channels
Python批量ppt转图片，pdf转图片，word转图片脚本
2024-04-04 00:00

2301_79655438的博客 ①　2000多本Python电子书（主流和经典的书籍应该都有了）②　Python标准库资料（最全中文版）③　项目源码（四五十个有趣且经典的练手项目及源码）④　Python基础入门、爬虫、web开发、大数据分析方面的视频（适合...
python如何实现从图片中的时间到完整时间格式 python
2023-03-10 21:49

回答 4 已采纳 import datetime a = [10100,108,12.2,12.32,17,208,17,308,17,408,17,508,17,608,17,708,17,808,14.2,14
python或C#如何裁切一张A4大小的图片(分辨率为300x300)裁切后不会掉分辨率 c# python 图像处理
2023-04-06 12:39

回答 2 已采纳看下后缀的问题，如果你保存的是jpg或者jpeg的格式，jpg好像全部都是96的dpi。保存为png或者bmp格式应该就不会了或者PIL保存的时候指定一下dpiimage.save('123.png'
python合并pdf，与向pdf插入图片 python
2021-11-09 16:18

回答 1 已采纳 1、把签名图片另存为pdf文件2、使用PyPDF2合并PDF 使用python将多份pdf文件合并成一份 - 知乎你一定有过，或者
c#如何解析PDF文档
2023-04-05 08:40

openwin_top的博客 iTextSharp是一个流行的开源库，用于处理PDF文档。...以上是两种常用的C#解析PDF文档的方法，当然，还有其他的库和工具可供选择，根据实际需求选择最合适的方法即可。在C#中，可以使用许多库和工具来解析PDF文档。
python批量pdf转excel，多喝个list无法转为excel数据 python 有问必答
2021-08-01 21:53

回答 2 已采纳 to_excel()函数在每次循环中都写入一次，会覆盖写入，结果就是最后一组的数据。如果要获取全部的，可以在循环中用append方法，写成一个整的数据框，然后在循环外用to_excel写入。 impo
如何利用python实现shp转json json python 有问必答
2021-11-02 15:59

回答 2 已采纳用python操作的话，可以这么做：先request.get(）获取各个文件，然后编写解析转换成需要的格式文件，shp转换为geojson可参考这篇文章。利用Pytho
python和C#之间传参 c# python
2022-12-08 19:23

回答 1 已采纳不同语言直接传递参数，有以下几个方案。第一个调用另一个，第一个启动的程序处理完成，使用带参数的启动方式启动另一个程序，另一个程序启动时读取处理就可以了，比如：c# 调用python 可以用 pyth
Python批量ppt转图片，pdf转图片，word转图片脚本(1)
2024-04-03 23:59

2401_84104357的博客这是我花了几天的时间去把Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。最近我才对这些路线做了一下新的更新，...
在编写PDF转图片的代码时遇到问题 python 人工智能有问必答
2023-04-06 09:36

回答 3 已采纳 AI支持什么格式的图片数据？支持2进制数据可以用pypdfium2将pdf每页内容处理成2进制数据后传递给AI。 from flask import Flask, request,render_tem
Python批量ppt转图片，pdf转图片，word转图片脚本(2)
2024-04-04 00:00

2301_79655438的博客 Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。
炸裂！PDF转Word彻底告别收费时代，这个OCR开源项目要逆天！
2022-10-24 13:05

Amusi（CVer）的博客导读随着企业数字化进程不断加速，PDF转Word的功能、纸质文本的电子化存储、文件复原与二次编辑、信息检索等应用都有着强烈的企业需求。目前市面上已有一些软件，但普遍需要繁琐的安装注册操作，大多还存在额度限制...
没有解决我的问题, 去提问

悬赏问题

¥15 sqlite 附加（attach database）加密数据库时，返回26是什么原因呢？
¥88 找成都本地经验丰富懂小程序开发的技术大咖
¥15 如何处理复杂数据表格的除法运算
¥15 如何用stc8h1k08的片子做485数据透传的功能？(关键词-串口)
¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗？
¥200 uniapp长期运行卡死问题解决
¥15 latex怎么处理论文引理引用参考文献
¥15 请教：如何用postman调用本地虚拟机区块链接上的合约？
¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题：[h264 @ 000000004faf7500]no frame？
¥15 乘性高斯噪声在深度学习网络中的应用

Python或c#实现图片格式的PDF转txt

1条回答 默认 最新

悬赏问题

1条回答默认最新