追梦小狂魔 2021-12-27 22:59 采纳率: 16.7%
浏览 313
已结题

python pymupdf 乱码 PDF文件中的公式是乱码状态

问题遇到的现象和发生背景

使用pymupdf读取文件里面的文字时公式全是乱码

问题相关代码,请勿粘贴截图
import fitz
docs = fitz.open("30.pdf")
for doc in docs:
    # blks = doc.get_text_blocks(flags = 4)
    blks = doc.get_text("blocks", sort=True)
    print(blks)

运行结果及报错内容

img

我的解答思路和尝试过的方法

我看有人弄了个ttf的字体,但是找不到相关资料

我想要达到的结果

输出正确不乱码的结果

  • 写回答

1条回答 默认 最新

  • CSDN专家-黄老师 2021-12-27 23:16
    关注

    先确定你的pdf是图片还是文档,如果从图片转pdf,这个是图像识别问题,如果是文档转,你要看看模块的一些参数设置

    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 1月3日
  • 创建了问题 12月27日

悬赏问题

  • ¥15 delta降尺度计算的一些细节,有偿
  • ¥15 Arduino红外遥控代码有问题
  • ¥15 数值计算离散正交多项式
  • ¥30 数值计算均差系数编程
  • ¥15 redis-full-check比较 两个集群的数据出错
  • ¥15 Matlab编程问题
  • ¥15 训练的多模态特征融合模型准确度很低怎么办
  • ¥15 kylin启动报错log4j类冲突
  • ¥15 超声波模块测距控制点灯,灯的闪烁很不稳定,经过调试发现测的距离偏大
  • ¥15 import arcpy出现importing _arcgisscripting 找不到相关程序