追梦小狂魔 2021-12-18 23:46 采纳率: 16.7%
浏览 300
已结题

使用pdfplumber出现cid

问题遇到的现象和发生背景

用pdfplumber读取pdf文件,出现cid,观察一看pdf中这一部分是公式

问题相关代码,请勿粘贴截图
import pdfplumber
# 读取pdf并选择对应的页数
pdf = pdfplumber.open('30.pdf')
page = pdf.pages[0]
# 提取文本并可视化
words = page.extract_text(x_tolerance=1)
print(words)
# tables=page.extract_table()
# print(tables)

运行结果及报错内容

img


文件内容是

img

我的解答思路和尝试过的方法

根据cid后面的数字还原公式

我想要达到的结果

还原pdf内容就行了,知道cid每个对应的是什么也行

  • 写回答

1条回答 默认 最新

  • 关注

    这个公式是图片,pdfplumber处理不了图片

    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 12月24日
  • 创建了问题 12月18日

悬赏问题

  • ¥15 数值计算均差系数编程
  • ¥15 redis-full-check比较 两个集群的数据出错
  • ¥15 Matlab编程问题
  • ¥15 训练的多模态特征融合模型准确度很低怎么办
  • ¥15 kylin启动报错log4j类冲突
  • ¥15 超声波模块测距控制点灯,灯的闪烁很不稳定,经过调试发现测的距离偏大
  • ¥15 import arcpy出现importing _arcgisscripting 找不到相关程序
  • ¥15 onvif+openssl,vs2022编译openssl64
  • ¥15 iOS 自定义输入法-第三方输入法
  • ¥15 很想要一个很好的答案或提示