python pymupdf 乱码 PDF文件中的公式是乱码状态

问题遇到的现象和发生背景

使用pymupdf读取文件里面的文字时公式全是乱码

问题相关代码，请勿粘贴截图

import fitz
docs = fitz.open("30.pdf")
for doc in docs:
    # blks = doc.get_text_blocks(flags = 4)
    blks = doc.get_text("blocks", sort=True)
    print(blks)

运行结果及报错内容

我的解答思路和尝试过的方法

我看有人弄了个ttf的字体，但是找不到相关资料

我想要达到的结果

输出正确不乱码的结果

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-黄老师 2021-12-27 23:16
关注
先确定你的pdf是图片还是文档，如果从图片转pdf，这个是图像识别问题，如果是文档转，你要看看模块的一些参数设置

解决
无用 11
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python之pandas读写文件乱码的解决方法
2020-12-23 18:13

python读写文件有时候会出现 ‘XXX’编码不能打开XXX什么的，用记事本打开...以上这篇Python之pandas读写文件乱码的解决方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持软件开发网。
python打印机打印word和PDF文件出来的是乱码
2024-10-21 08:46

bug菌¹的博客避免直接读取 Word 和 PDF 文件内容并传递到打印机。可以使用系统的打印功能，如，来处理文件的打印，避免编码和内容解析问题。确保打印机驱动程序正确安装并且支持相应的文件格式。希望如上措施及解决方案能够帮到...
python系列【仅供参考】：python3 生成pdf 中文乱码问题处理
2025-03-10 13:29

坦笑&&life的博客 python3 生成pdf 中文乱码问题处理
python解析pdf中文乱码_解析PDF文件以及解决编码问题
2020-12-09 14:11

weixin_39938165的博客 1、解析pdf文件最近需要将pdf中文本提取出来，于是就了解了一下pdfminer首先安装：pip3 install pdfminer3k之后就是用pdfminer解析，不多说，直接上代码，这些代码都是参考各位前辈from pdfminer.pdfparser import ...
【python】PyMuPDF操作pdf
2025-02-28 09:36

morris131的博客 PyMuPDF，也被称为fitz（这是其导入时的常用别名），是一个功能强大的Python库，用于处理PDF和其他文档格式。与 PyPDF2相比，PyMuPDF提供了更多的功能和更好的性能，特别是在处理复杂的PDF文件时。
python解析pdf乱码,python pdfkit 中文乱码问题的解决方案
2021-04-27 10:56

weixin_39855658的博客使用python pdfkit生成pdf文件中遇到中文乱码问题1.生成的文件名不能带有中文字符2.生成的pdf内容中文为乱码生成的文件名不能带有中文字符解决方法：我暂时想到的处理方式是先生成英文文件名，再将这个文件重命名为...
python+PyMuPDF库：(一)创建pdf文件及内容读取和写入
2024-12-27 11:29

觅远的博客安装：pip install PyMuPDF -i ...PyMuPDF可以修改pdf文件的内容。其他文件类型用PyMuPDF是只读的。但可以将任何文档（包括图像）转换为PDF（Document.convert_to_pdf()），然后将再使用PyMuPDF的功能进行操作。
python 中文乱码问题深入分析.docx
2021-11-25 13:03

Python 中文乱码问题深入分析在 Python 中，中文乱码问题一直是一个让人头疼的问题，经常抛...Python 中的中文乱码问题可以通过正确地使用 encode 和 decode 函数，设定默认编码，和正确地读取文件的编码格式来解决。
python html转pdf出现乱码_python生成html文件浏览器中文显示乱码问题
2021-02-09 03:08

兀亚子的博客 html文件中文在浏览器中显示乱码问题解决利用浏览器打开html文件时,中文显示乱码,如下是原文件的内容 1 2 3 python matplotlib 中文显示乱码设置 python matplotlib 中文显示乱码设置原因:是matplotlib库中没有...
Python中文乱码详解.pdf
2021-11-10 13:50

在Python中处理中文乱码，通常需要明确指定编码方式，例如在读写文件时指定`encoding='utf-8'`，或者在字符串操作中使用`encode()`和`decode()`方法。总结来说，Python中文乱码问题涉及字符编码的基础知识，包括...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 1月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月27日

python pymupdf 乱码 PDF文件中的公式是乱码状态

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果

1条回答 默认 最新

问题事件

1条回答默认最新