这个是源代码。
xpath1=r'//title/text()'
resp=requests.get(url)
text=resp.text
html=etree.HTML(text)
名字=html.xpath(xpath1)
print(名字)
1
['15bc3133-f15a-4f99-87fa-dcfa1961d289PPT模板-']
奇怪的是,PPT模板是正常的,但是前面这一块成了乱码一样的东西。
猜想,是不是,一种编码方式,需要我进行解码,如果是这样,请说一下这种是怎么样的编码方式,如何解码,得出正确的标题。