想查找.docx文件中的关键字,并且输出结果,代码如下:
from docx import Document
import os,sys
choice = input('''
请输入需要查找文件的位置:
1.2018年工作
2.2019年工作
3.2020年工作
4.2021年工作
5.桌面查找
''')
keyword = input('请输入需要查找的关键字:')
if choice == '1':
scripts_path = 'E:/2018养老中心/'
elif choice == '2':
scripts_path = 'E:/2019养老中心/'
elif choice == '3':
scripts_path = 'E:/2020养老中心/'
elif choice == '4':
scripts_path = 'E:/2021养老中心/'
elif choice == '5':
scripts_path = r'C:\Users\Lenovo\Desktop'
files_path_list = []
for root,dirs,files in os.walk(scripts_path):
if files:
for file in files:
if file.endswith(".docx"):
files_path_list.append(os.path.join(root,file).replace("\\","/"))
try:
for i in files_path_list:
document = Document(i)
for paragraph in document.paragraphs:
if keyword in paragraph.text:
print('找到了文件位置在:'+i)
except:
print('docx.opc.exceptions.PackageNotFoundError:')
现在的问题有两个:
1.总是提示:docx.opc.exceptions.PackageNotFoundError:Package not found at+文件名,不知道怎么处理,只能加一个try except
2.在以下代码:
for paragraph in document.paragraphs:
if keyword in paragraph.text:
print('找到了文件位置在:'+i)
这段代码中,输入的关键字在word中多次重复出现,于是输出的结果,就是出现几次输出几次结果
现在我需要解决的是
1.解决“docx.opc.exceptions.PackageNotFoundError:Package not found at+文件名”这个错误
2.关键词在word中多次出现,只输出一个结果
请各位老师、大神帮帮忙