错误信息为list index out of range,但不知道哪里错了
import requests
from lxml import etree
if __name__ == '__main__':
headers={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36'
}
#爬取到页面源码数据
url='https://newhouse.fang.com/house/s/'
page_text=requests.get(url=url,headers=headers).text
#数据解析
tree=etree.HTML(page_text)#注意不可以再用parse了,因为我们需要的是网页上的数据,而不是本地数据
#存储的就是li标签对象
li_list=tree.xpath('//ul/li')
fp=open('58.txt','w',encoding='utf-8')
for li in li_list:
title=li.xpath('./div/div[2]/div[1]/div/a/text()')[0]
print(title)
fp.write(title+'\n')