下面代码 pdfplumber读取pdf文件的内容输出是none是什么问题

下面代码 pdfplumber读取pdf文件的内容输出是none
是什么问题

import pdfplumber
# 打开PDF文件
with pdfplumber.open('C:/Users/xhz1cng/Desktop/3398157986.pdf') as pdf:  
    # 遍历PDF页码    
    for page in pdf.pages:        
        # 获取页码文本内容        
        text = page.extract_text()       
        # 输出每一页的文本内容       
        print(text)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
疯狂的豆包 2023-04-12 18:36
关注
在使用pdfplumber提取文本内容时，如果某一页的文本内容为空，或者PDF文件本身没有包含文本内容，那么page.extract_text()方法将返回None，因此在输出时会显示为None。

为了避免输出None，可以在输出之前先进行判断，例如：

if text is not None: print(text)

这样可以确保只输出非空文本内容。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python使用pdfplumber从pdf文件中获取表格信息
2024-01-19 11:29

weixin_39772782的博客 python使用pdfplumber从pdf文件中获取表格信息，
Python-pdfplumber读取PDF内容
2024-02-22 15:17

总裁余(余登武)的博客 pdfplumber还可以获得页面上的所有单词、直线、方格、乃至曲线的位置信息，具体可以看看官网的说明：https://github.com/jsvine/pdfplumber。
Python的pdfplumber库将PDF文件转成图片文件的实现
2024-01-18 11:42

weixin_39772782的博客 Python的pdfplumber库将pdf转为图片的实现
Python 快速合并PDF表格转换输出CSV文件
2024-01-04 22:11

Hann Yang的博客单位的刷脸考勤机后台系统做得比较差，只能导出每个部门的出勤统计表pdf，近期领导要看所有部门的考勤数据，于是动手快速写了个合并pdf并输出csv文件的脚本
深入探索pdfplumber：从PDF中提取信息到实际项目应用
2024-02-23 15:05

一键难忘的博客在数据处理和信息提取的过程中，PDF文档是一种常见的格式。然而，要从PDF中提取信息并进行进一步...本文将介绍如何使用Python库中的pdfplumber库来读取PDF文档，并通过实际代码示例演示如何将提取的信息写入Excel文件。
python读取pdf文件（pdfplumber）
2021-09-24 09:50

qq_492448446的博客 Pdfplumber是一个可以处理pdf格式信息的库。可以查找关于每个文本字符、矩阵、和行的详细信息，也可以对表格进行提取并进行可视化调试。文档参考https://github.com/jsvine/pdfplumber 2.pdfplumber安装安装...
spyder读取txt/pdf/word格式的文档：代码
2025-02-08 23:31

大江歌罢的博客读取txt格式、pdf格式以及文件夹内的pdf以及word格式混在一起的文本
工具--读取PDF文档中的表格生成EXCEL文件【支持页面范围哟】
2021-11-16 19:30

enjoy编程的博客大家也知道在PDF文档中查看、操作表格都不方便，就想着写一个小工具：读取PDF文档中的表格生成EXCEL文件这样，在EXCEL文件中就可以随心所欲的操作了。???????????????????? 开发工具 pdfplumber简介综合比较后，...
Python循环获取PDF中的所有表格，然后输出成一个Excel文件！方便清洗数据！
2024-12-12 00:17

栽树先生～的博客 Python循环获取PDF中的所有表格，然后输出成一个Excel文件！方便清洗数据！
Python异步编程｜PySimpleGUI界面读取PDF转换Excel
2024-01-06 17:10

Hann Yang的博客当时时间紧，没有好好做界面且输出csv文件了事。今天趁周六休息，把代码做一下升级处理，使用库pdfplumber直接遍历多个pdf文件，得到数据后输出Excel文件即可。之前先合并pdf文件再取数，纯粹有点多余。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月11日

下面代码 pdfplumber读取pdf文件的内容输出是none是什么问题

1条回答 默认 最新

问题事件

1条回答默认最新