X—DT 2021-10-26 22:34 采纳率: 100%
浏览 40
已结题

python 爬取网页时出现多种错误

我想要爬取的是sensortower这个网站上的软件排行榜和软件信息,使用selenium,主要代码是下面这个图这样

img

          (most Traceback recent ca1t Last)
 File /users sunchubai/DownLoads/rank2.py Line 95,in<module>
   rating anal.xpath(//*[@id app-profile-ratings"]/div[2]/div/div/span[1]/meta[2]·)[e].xpath( @content 一 一
           List IndexErrOr: index 0utof Pange

常常报错的问题是下面图中的评分

img

#软件评分
#rating anal.xpath(// *@id =“app-profile-ratings"]/div[2]/div/div/span[1]/text())
#rating anal.xpath(//*[@id 1=“app-profile-ratings"]/div[2]/div/div/span[1]/meta[2][e].xpath(dcontent)
#rating =anal.xpath(//*[@id=“app-profile-ratings"]/div[2]/div/div/span[1]/meta[2][].attrib['content]
#print(rating
共评分数
热catingcount..anal.ath(./*l@d=app-profile.catings/diy.2l/div/div/spanl2]/textO).)
#print(ratingcount

在谷歌上搜索之后尝试了一些办法,但是这个代码也没有起到作用,还是依旧会报错。

img

try:
            anal.xpath(//*[@id= Pating 一 app-profile-ratings"]/div[2]/div/div/span[1]/meta[2])[o].xpath(@content')
except IndexErrOr:
    rating nuL7

目前已经出现的错误中最常出现的是这个

img

          (most Traceback recent ca1t Last)
 File /users sunchubai/DownLoads/rank2.py Line 95,in<module>
   rating anal.xpath(//*[@id app-profile-ratings"]/div[2]/div/div/span[1]/meta[2]·)[e].xpath( @content 一 一
           List IndexErrOr: index 0utof Pange

还请帮忙看看,我要怎么解决这个问题。 谢谢!

  • 写回答

2条回答 默认 最新

  • CSDN专家-HGJ 2021-10-26 22:52
    关注

    代码中anal.xpath(//*[@id= Pating 一 app-profile-ratings"]/div[2]/div/div/span[1]/meta[2])可能获取到为空列表,不能用[0]索引取值。
    为演示代码,这里使用lxml库解析,试试这样:

    s='''<div>
    <span class ="stars">
    <meta itemprop="worstRating" content="0">
    <meta itemprop="ratingValue" data-bind="attr:{content:$data.rating}" content="3.93239"}></span>
    <span class="stars five gold" data-bind="style:{width:data.rating*100/5+'%'}" style ="width: 78.6478%;"></span>'''
    from lxml import etree
    html=etree.HTML(s)
    try:
        ele= html.xpath("//div/span[1]/meta[2]")
        print(ele)
        rating=ele[0].attrib['content']
    
    except:
        rating=''
    print(rating)
    

    运行结果:

    F:\2021\qa\ot2>t6
    [<Element meta at 0x2e5c5d7a648>]
    3.93239
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 11月4日
  • 已采纳回答 10月27日
  • 创建了问题 10月26日

悬赏问题

  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器