我想问的就是如何利用python提取电脑中html文件,然后利用关键词精准地提取出电话号码、qq号、邮箱等等一些个人的虚拟身份。
我想问的就是如何利用python提取电脑中html文件,然后利用关键词精准地提取出电话号码、qq号、邮箱等等一些个人的虚拟身份。
用python提取电脑中html文件是:
with open("xxx.html","r",encoding="utf-8") as fileObj:
data = fileObj.read()
要提取出电话号码、qq号、邮箱等信息, 需要根据这些信息的前后内容的特征写正则表达式。
你把html文件的内容发一下,正则表达式要根据文件内容的格式来写。