pdf提取表格到excel，输出有错，哪里的问题

是不是代码写错了呢，到底是哪里出了问题呢，提取pdf表格到excel上，运行提示错误

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2024-06-06 13:14
关注
以下内容由CHATGPT及阿里嘎多学长共同生成、有用望采纳：

从提供的代码片段和错误信息来看，问题出在 workbook 这个变量的使用上。错误提示 TypeError: 'module' object is not callable 表明 workbook 被当作一个函数来调用了，但实际上它应该是 openpyxl 模块中的一个类。这里的问题很可能是 workbook 变量被错误地赋值为 openpyxl 模块本身，而不是 Workbook 类的实例。

下面是代码中可能出现问题的几个地方以及如何修复它们：

导入模块时的拼写错误：

代码中 from openpyxl import workbook 应该改为 from openpyxl import Workbook（注意首字母大写）。

创建工作簿实例时的错误：

代码中 workbook = workbook 这一行实际上没有做任何事情，因为左边的 workbook 被赋值为了 openpyxl 模块，而不是 Workbook 类的实例。正确的做法是使用 Workbook() 来创建一个新的工作簿实例。

提取表格数据并保存到Excel：

需要确保 pdfplumber 正确地提取了表格数据，并且 openpyxl 被用来创建和保存Excel文件。

修复后的代码可能如下所示：

import pdfplumber from openpyxl import Workbook # 注意这里首字母大写 # 打开PDF文件 with pdfplumber.open("外协费-晋华航空（99950）.pdf") as pdf: # 获取第9页 first_page = pdf.pages[9] # 提取表格数据 table = first_page.extract_table() # 创建一个新的Excel工作簿 workbook = Workbook() # 选择活动的工作表 sheet = workbook.active # 将PDF表格数据添加到Excel工作表中 for row in table: sheet.append(row) # 保存Excel文件 workbook.save(filename='luomiqi.xlsx') # 注意文件扩展名应为.xlsx

注意：

确保 "外协费-晋华航空（99950）.pdf" 是正确的文件路径。
Excel文件的扩展名应该是 .xlsx 而不是 .xls。

参考资料：

pdfplumber 官方文档：https://github.com/jsvine/pdfplumber
openpyxl 官方文档：https://openpyxl.readthedocs.io/en/stable/

以上修复后的代码应该能够解决你遇到的问题。如果还有其他问题或需要进一步的帮助，请随时提问。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

从Word表格批量提取数据到Excel.zip
2021-11-13 12:03

市场上也有一些第三方软件，如“Tabula”或“Text-to-Spreadsheet”，它们专门用于从PDF或Word文档中提取表格数据到Excel。但请注意，这些工具可能不适用于所有情况，且可能会丢失一些格式信息。五、手动操作的...
Python一键提取PDF中的表格到Excel
2023-01-28 10:26

总的来说，通过Python的PyPDF2和pandas库，我们可以高效地完成从PDF中提取表格并转换为Excel格式的任务。这种方法在数据处理工作流中非常实用，尤其是当需要大量处理包含表格的PDF文件时，能够显著提高工作效率。...
用Python提取PDF表格到Excel文件
2024-09-24 14:31

Eiceblue的博客本文演示如何使用Python提取PDF文档表格数据到Excel文件中。
python自动办公-24 Python一键提取PDF中的表格到Excel
2022-11-04 16:41

- **Tabula-py**: Tabula-py是基于Java的Tabula工具的Python接口，专门用于从PDF中提取表格。它可以更准确地识别和转换表格，相比直接使用PyPDF2更为方便。 2. **PDF文件解析**： - PDF文件是一种复杂的数据结构...
Python一键提取PDF中的表格到Excel.zip
2025-08-16 09:51

尽管这些库在提取表格数据方面各有优劣，但是它们普遍都能较好地实现从PDF到Excel的数据迁移。在处理提取出来的数据时，Python的pandas库是进行数据处理和分析的不二选择。它提供了丰富的数据结构和操作工具，能够...
读取PDF中的excel表格，并写入excel中
2024-03-30 22:58

这个任务看似复杂，但通过使用特定的软件和插件，我们可以实现PDF到Excel的转换并顺利读取、写入数据。本教程将详细介绍如何完成“读取PDF中的excel表格，并写入excel中”的操作。首先，我们要理解PDF（Portable ...
python实例-Python一键提取PDF中的表格到Excel
2024-12-16 09:35

通过Python实现从PDF提取表格数据并导出到Excel的功能是一个综合性的项目，它涉及到编程、数据处理以及对特定业务需求的理解。熟练掌握相关库和工具的使用，能够帮助我们高效地完成这一任务，从而提高工作效率和数据...
Python完整程序-Python一键提取PDF中的表格到Excel.zip
2025-01-25 22:12

在本压缩包中，涉及的核心功能是利用Python编程语言提取PDF文件中的表格数据，并将这些数据导出到Excel文件中，这在数据处理和分析工作中是非常常见且实用的需求。该程序的实现利用了Python的几个重要库：首先是`...
Python自动化办公：批量提取PDF中的表格到Excel
2024-10-08 12:22

Deh0rs的博客通过Python的ospdfplumber和openpyxl模块，我们可以轻松实现批量提取PDF中的表格数据，并将其写入Excel文件。这一自动化流程不仅提高了工作效率，还减少了人为错误。对于需要处理大量PDF文件的办公人员来说，这一...
Python一键提取PDF中的表格到Excel.rar
2024-06-14 11:02

总结来说，Python结合 `PyPDF2` 和 `tabula-py` 库，为我们提供了一种有效且高效的方法来从PDF文件中提取表格数据，并将其导出到Excel格式。这对于需要处理大量PDF文档的数据工作者来说，是一个非常实用的工具。在...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 6月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月6日

pdf提取表格到excel，输出有错，哪里的问题

3条回答 默认 最新

问题事件

3条回答默认最新