Lazulitecn 2021-04-10 11:21 采纳率: 84.8%
浏览 350
已结题

Python爬虫遇到 javax.faces.ViewState这个类似ID号的Form怎么处理呢?

POST查询信息的formdata有这个key,value是个类似序号ID的内容,单个有时效,而且会变,关闭查询页面后ID值会+1,但是直接在爬虫里将ID循环+1后查询结果为空,或者一直使用同一个ID号,但是到后面锁查询的信息就不会更新了。

现在我是每次查询都重新登录一次帐号,因为登陆后的序号是固定的,但是现在需要连续查询多个内容,效率太低了,请问该怎么处理呢?

  • 写回答

1条回答 默认 最新

  • 漠上刀栈 2021-04-10 11:29
    关注

    你这个描述,很难给出具体答案了。

    一般来说,这种都是序列化之后的一个ID,但是既然放在前端,就会有生成规则。

    看描述,应该是当前页面返回的值中,会生成一些代码,然后这些代码序列化为这个ID,然后后端会验证这个ID,防止无脑爬虫。

    想要越过也简单,一般来说,这种ID都是通用的方法,通常会类似cookie的方式,你要做的就是,每次在访问页面的返回值里面,解析出来这个ID(考虑正则,拼接等方式,从页面能找到答案的),然后在搜索的时候放在formdata的javax.faces.ViewState中。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 8月6日

悬赏问题

  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器