P.Y.ton.h 2021-07-31 14:08 采纳率: 100%
浏览 91
已结题

List index out of range.

img

img

  • 写回答

3条回答 默认 最新

  • CSDN专家-HGJ 2021-07-31 14:20
    关注

    索引越界是因为按照正则式没有匹配到结果,获取数据为空。1.将Spider.root_pattern,改写成root_pattrern,2.检查root_pattern正则式是否正确。

    先不要写成函数,获取页面,解析,改一下正则,这样这可获取到相应的页面内容。参考代码:

    import re
    from urllib.request import urlopen
    
    url='https://www.huya.com/g/wzry'
    r=urlopen(url).read().decode()
    print(r)
    root_pattern='<span class="txt">[\s\S](.*?)</div>'
    root_html=re.findall(root_pattern,r,re.S)
    title = re.findall('<i class="nick" title=(.*?)>', r)
    print(root_html)
    print(title)
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 8月8日
  • 已采纳回答 7月31日
  • 创建了问题 7月31日

悬赏问题

  • ¥60 pb数据库修改或者求完整pb库存系统,需为pb自带数据库
  • ¥15 spss统计中二分类变量和有序变量的相关性分析可以用kendall相关分析吗?
  • ¥15 拟通过pc下指令到安卓系统,如果追求响应速度,尽可能无延迟,是不是用安卓模拟器会优于实体的安卓手机?如果是,可以快多少毫秒?
  • ¥20 神经网络Sequential name=sequential, built=False
  • ¥16 Qphython 用xlrd读取excel报错
  • ¥15 单片机学习顺序问题!!
  • ¥15 ikuai客户端多拨vpn,重启总是有个别重拨不上
  • ¥20 关于#anlogic#sdram#的问题,如何解决?(关键词-performance)
  • ¥15 相敏解调 matlab
  • ¥15 求lingo代码和思路