峰勇力 2021-12-07 15:43 采纳率: 0%
浏览 201

爬虫时query string parameters的部分参数是动态怎么破?

  • 写回答

3条回答 默认 最新

  • 关注

    获取网页文本后,用xpath提取a标签内的超链接

    img

    //*[@id="gzlist"]/li[1]/dl/a
    

    匹配到后通过xpath匹配的内容获取信息
    如果反扒机制太高了,可以试试 python selelnium 爬虫框架,一个个进行采集数据.
    有帮助请采纳,谢谢

    评论 编辑记录

报告相同问题?

问题事件

  • 创建了问题 12月7日

悬赏问题

  • ¥15 网站设计与开发职业技能大赛试题
  • ¥20 在使用CESM2.2.0模型进行case.submit过程中出现如下错误(关键词-Map)
  • ¥15 有办法改变通过wifi进入的网站的设置吗
  • ¥15 所以到底怎么算!算到凌晨五点都算不出来!
  • ¥15 label_studio
  • ¥15 请教如何phython发邮件
  • ¥15 linux系统安装问题
  • ¥15 路径规划如何采用矢量法让他们尽量在一个方向
  • ¥15 crypto 一道rsa解密题
  • ¥15 survIDINRI已将生存时间转为数值变量,仍错误 Time variable is not numeric。