使用python提取PDF里面的表格，使用pdfplumber提取

如题使用python提取PDF里面的表格，使用pdfplumber提取，使用extract_text（）可以提取表格里的内容，但使用extract_table提取，却提取不到内容，print空none

文件是https://pdf.dfcfw.com/pdf/H2_AN202104151485341072_1.pdf?1618513393000.pdf

各位可以下载试试，注意：从第8页开始有大量的表格数据。只能提取大小2K的不需要的第3页数据。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-06-26 03:14
关注
pdfplumber提取文本和表格，最适合机器生成的 PDF，而不是扫描的 PDF。参考https://zhuanlan.zhihu.com/p/353397002，https://github.com/jsvine/pdfplumber

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用python提取嵌套列表元素 python
2020-11-13 19:11

回答 2 已采纳 li = [1, 2, [3, 4], 5] new = [] for item in li: if isinstance(item, list): new.extend(
用pdfplumber爬取pdf里面的表格，结果没报错，但是出现了很多的None，该怎么办 python 有问必答爬虫
2021-12-02 12:13

回答 2 已采纳你加个判断，如 if table[i][j] != None: pass
python提取excel中的特定数据 python
2022-04-09 00:12

回答 2 已采纳 import pandas as pd df=pd.read_excel('abc.xlsx') df=df.filter(regex='销售数据',axis=1) df.to_excel('bcd.
python批量提取PDF中的表格到Excel文档
2023-10-13 01:46

使用python批量读取PDF中的表格数据并写入Excel文档实现思路：使用os、pdfplumber、openpyxl模块实现 os ：用于获取pdf文件 ...3、提取PDF中的表格 4、创建Excel工作表 5、向工作表中添加数据 6、保存Excel表格
python使用python-docx模块读取word表格发生重复 python
2021-03-05 23:08

回答 4 已采纳遍历的时候有意识去重就可以了 value_list = list() for row in table.rows: temp = list() for cell in row.ce
python 提取excel的某几列的数据 list python
2021-02-08 08:52

回答 3 已采纳 import pandas as pd file_name = r"new.xlsx" df = pd.read_excel(file_name) columns = ["a","c","e"]
用Python循环提取每个月的数据 python 有问必答
2022-06-24 06:08

回答 6 已采纳假如是如2020-01-01这样日期数据，可使用pandas提取。样例数据： date,open,close,high,low,volume 2021-01-04,4.31,4.42,4.45,4.3
通过Python的pdfplumber库提取pdf中表格数据
2023-05-28 18:33

空空star的博客通过Python的pdfplumber库提取pdf中表格数据。
PYTHON PDF解析如何跨页解析表格 python
2023-03-01 14:45

回答 2 已采纳将跨页表格的内容合并在一起。先定义了一个函数 extract_tables，它打开 PDF 文件并提取所有页面中的表格内容。然后循环遍历每一页，并使用 extract_tables() 方法提取每一页
如何使用python爬虫单独提取经验与学历避开工资 python 前端
2022-07-21 14:17

回答 4 已采纳 find() 方法检测字符串中是否包含子字符串 str 。一个是div标签的文本，一个是span标签的文本。都不是同一个标签下，这很好取呀。你是用的什么方法获取的？
python使用re模块提取列表中对应字段 list python
2020-04-24 00:01

回答 2 已采纳你最好多给出几个样例，以便区分不同的数据就你的来说，这么写就可以。 ``` # -*- coding: UTF-8 -*- import re list=["\r\r\n 双流市场设备
python提取pdf表格数据无边框_Python使用Tabula提取PDF表格数据
2020-12-29 05:53

大奥子的博客今天遇到一个批量读取pdf文件中表格数据的需求，样式大体是以下这样：python读取PDF无非就是三种方式(我所了解的)，pdfminer、pdf2htmlEX 和 Tabula。综合考虑后，选择了最后一种。...如果只是提取pdf里面的文本内...
怎么用python提取string里的数字并求和 python
2022-03-22 22:56

回答 2 已采纳 import res = 'xxxx'sum = 0for num in re.findall('\d+', s): sum += int(num)print(sum)
python使用pdfplumber从pdf文件中获取表格信息
2024-01-19 11:29

weixin_39772782的博客 python使用pdfplumber从pdf文件中获取表格信息，
Python使用pdfplumber直接提取PDF文本内容
2021-08-19 11:03

y_bccl27的博客前提：提取的文件必须是应用服务生成PDF文件，而非扫描的pdf文档，当前pdfplumber的版本为0.5.28 该开源包在github上面的地址：https://github.com/jsvine/pdfplumber 第一步：在服务应用的终端中使用下述命令安装...
没有解决我的问题, 去提问

悬赏问题

¥20 删除和修改功能无法调用
¥15 kafka topic 所有分副本数修改
¥15 小程序中fit格式等运动数据文件怎样实现可视化？（包含心率信息））
¥15 如何利用mmdetection3d中的get_flops.py文件计算fcos3d方法的flops？
¥40 串口调试助手打开串口后,keil5的代码就停止了
¥15 电脑最近经常蓝屏，求大家看看哪的问题
¥60 高价有偿求java辅导。工程量较大，价格你定，联系确定辅导后将采纳你的答案。希望能给出完整详细代码，并能解释回答我关于代码的疑问疑问，代码要求如下，联系我会发文档
¥50 C++五子棋AI程序编写
¥30 求安卓设备利用一个typeC接口，同时实现向pc一边投屏一边上传数据的解决方案。
¥15 SQL Server analysis services 服务安装失败

使用python提取PDF里面的表格，使用pdfplumber提取

1条回答 默认 最新

悬赏问题

1条回答默认最新