2401_84482571 2024-09-05 17:07 采纳率: 66.7%
浏览 5

可以运行,但是写出来没有数据

import re
from pdfminer.high_level import extract_text
from pdfminer.layout import LAParams
import openpyxl

提取PDF中的文本信息

with open('发票.pdf', 'rb') as file:
text = extract_text(file, laparams=LAParams(line_margin=1))

定义正则表达式

regex = r"编号:(.*?)(?:\n|$)"
xinyongcodes = re.findall(regex,text)

创建一个新的Excel工作簿

workbook = openpyxl.Workbook()
sheet = workbook.active

写入数据到Excel

row_num = 1
for code in xinyongcodes:
if code.strip():
sheet.cell(row=row_num, column=1, value=code.strip())
row_num += 1

保存Excel文件

workbook.save(filename='luomiqi1.xlsx')

  • 写回答

1条回答 默认 最新

  • 2401_86614810 2024-09-08 17:02
    关注

    你去Excel文件里看。

    评论

报告相同问题?

问题事件

  • 创建了问题 9月5日

悬赏问题

  • ¥60 如何批量获取json的url
  • ¥15 对法兰连接元件所承受的表面载荷等效转化为法兰开孔接触面上的等效表面载荷?
  • ¥15 comsol仿真压阻传感器
  • ¥15 Python线性规划函数optimize.linprog求解为整数
  • ¥15 llama3中文版微调
  • ¥15 pg数据库导入数据序列重复
  • ¥15 三分类机器学习模型可视化分析
  • ¥15 本地测试网站127.0.0.1 已拒绝连接,如何解决?(标签-ubuntu)
  • ¥50 Qt在release捕获异常并跟踪堆栈(有Demo,跑一下环境再回答)
  • ¥30 python,LLM 文本提炼