yxr996 2023-03-26 10:47 采纳率: 14.3%
浏览 52
已结题

python爬取二手房信息的问题

错误信息为list index out of range,但不知道哪里错了


import requests
from lxml import etree
if __name__ == '__main__':
    headers={
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36'
    }
    #爬取到页面源码数据
    url='https://newhouse.fang.com/house/s/'
    page_text=requests.get(url=url,headers=headers).text
    #数据解析
    tree=etree.HTML(page_text)#注意不可以再用parse了,因为我们需要的是网页上的数据,而不是本地数据
    #存储的就是li标签对象
    li_list=tree.xpath('//ul/li')
    fp=open('58.txt','w',encoding='utf-8')
    for li in li_list:
        title=li.xpath('./div/div[2]/div[1]/div/a/text()')[0]
        print(title)
        fp.write(title+'\n')
  • 写回答

3条回答 默认 最新

  • 海洋 之心 2022年度博客之星人工智能领域TOP 1 2023-03-26 11:01
    关注

    根据您提供的代码和报错信息,问题出现在 title=li.xpath('./div/div[2]/div[1]/div/a/text()')[0] 这一行,数组越界了。这可能是由于某些 li 标签没有找到对应的标题导致的。为了解决这个问题,您可以在获取标题之前,先判断一下是否有标题存在,例如:

    title_list = li.xpath('./div/div[2]/div[1]/div/a/text()')
    if title_list:
        title = title_list[0]
        print(title)
        fp.write(title+'\n')
    else:
        print('No title found.')
    

    这样,如果某个 li 标签没有找到对应的标题,就会打印出 No title found. 的提示信息,而不会导致数组越界错误。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 4月3日
  • 已采纳回答 3月26日
  • 创建了问题 3月26日

悬赏问题

  • ¥20 怎么用dlib库的算法识别小麦病虫害
  • ¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
  • ¥15 java写代码遇到问题,求帮助
  • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
  • ¥15 有了解d3和topogram.js库的吗?有偿请教
  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
  • ¥15 关于#Java#的问题,如何解决?
  • ¥15 加热介质是液体,换热器壳侧导热系数和总的导热系数怎么算