3条回答 默认 最新
- CSDN专家-HGJ 2021-07-31 14:20关注
索引越界是因为按照正则式没有匹配到结果,获取数据为空。1.将Spider.root_pattern,改写成root_pattrern,2.检查root_pattern正则式是否正确。
先不要写成函数,获取页面,解析,改一下正则,这样这可获取到相应的页面内容。参考代码:
import re from urllib.request import urlopen url='https://www.huya.com/g/wzry' r=urlopen(url).read().decode() print(r) root_pattern='<span class="txt">[\s\S](.*?)</div>' root_html=re.findall(root_pattern,r,re.S) title = re.findall('<i class="nick" title=(.*?)>', r) print(root_html) print(title)
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决评论 打赏 举报无用 2
悬赏问题
- ¥60 pb数据库修改或者求完整pb库存系统,需为pb自带数据库
- ¥15 spss统计中二分类变量和有序变量的相关性分析可以用kendall相关分析吗?
- ¥15 拟通过pc下指令到安卓系统,如果追求响应速度,尽可能无延迟,是不是用安卓模拟器会优于实体的安卓手机?如果是,可以快多少毫秒?
- ¥20 神经网络Sequential name=sequential, built=False
- ¥16 Qphython 用xlrd读取excel报错
- ¥15 单片机学习顺序问题!!
- ¥15 ikuai客户端多拨vpn,重启总是有个别重拨不上
- ¥20 关于#anlogic#sdram#的问题,如何解决?(关键词-performance)
- ¥15 相敏解调 matlab
- ¥15 求lingo代码和思路