问题遇到的现象和发生背景
使用pymupdf读取文件里面的文字时公式全是乱码
问题相关代码,请勿粘贴截图
import fitz
docs = fitz.open("30.pdf")
for doc in docs:
# blks = doc.get_text_blocks(flags = 4)
blks = doc.get_text("blocks", sort=True)
print(blks)
运行结果及报错内容
我的解答思路和尝试过的方法
我看有人弄了个ttf的字体,但是找不到相关资料
我想要达到的结果
输出正确不乱码的结果