从网上下载了单词表,但是我现在只想要里面的单词来做匹配,所以我的思路是想把原来的pdf转化为字典然后用key转化为列表,或者有更好的能一步直达的办法?
收起
具体格式呢? 参考下文,把pdf读取转到excel,再把表格转成字典可行:
用python 将PDF中的表格转化为Excel_ziyin_2013的博客-CSDN博客_python将pdf转成excel 这几天想统计一下《中国人文社会科学期刊 AMI 综合评价报告(2018 年):A 刊评价报告》中的期刊,但是只找到了该报告的PDF版,对于表格的编辑不太方便,于是想到用Python将表格转成Excel格式。看过别人写的博客,发现Python解析PDF有以下四种方式:-pdfminer:擅长文字的解析,把表格解析成普通的文本,没有格式;-pdf2html:把pdf解析成html,但html的标... https://blog.csdn.net/ziyin_2013/article/details/87980434
报告相同问题?