xiesansui_1314 2023-04-11 19:31 采纳率: 0%
浏览 27

下面代码 pdfplumber读取pdf文件的内容输出是none是什么问题

下面代码 pdfplumber读取pdf文件的内容输出是none
是什么问题

img

import pdfplumber
# 打开PDF文件
with pdfplumber.open('C:/Users/xhz1cng/Desktop/3398157986.pdf') as pdf:  
    # 遍历PDF页码    
    for page in pdf.pages:        
        # 获取页码文本内容        
        text = page.extract_text()       
        # 输出每一页的文本内容       
        print(text)
  • 写回答

1条回答 默认 最新

  • 疯狂的豆包 2023-04-12 18:36
    关注

    在使用pdfplumber提取文本内容时,如果某一页的文本内容为空,或者PDF文件本身没有包含文本内容,那么page.extract_text()方法将返回None,因此在输出时会显示为None。

    为了避免输出None,可以在输出之前先进行判断,例如:

    if text is not None:
        print(text)
    

    这样可以确保只输出非空文本内容。

    评论

报告相同问题?

问题事件

  • 创建了问题 4月11日