Lazulitecn 2021-04-10 11:21 采纳率: 84.8%
浏览 355
已结题

Python爬虫遇到 javax.faces.ViewState这个类似ID号的Form怎么处理呢?

POST查询信息的formdata有这个key,value是个类似序号ID的内容,单个有时效,而且会变,关闭查询页面后ID值会+1,但是直接在爬虫里将ID循环+1后查询结果为空,或者一直使用同一个ID号,但是到后面锁查询的信息就不会更新了。

现在我是每次查询都重新登录一次帐号,因为登陆后的序号是固定的,但是现在需要连续查询多个内容,效率太低了,请问该怎么处理呢?

  • 写回答

1条回答 默认 最新

  • 漠上刀栈 2021-04-10 11:29
    关注

    你这个描述,很难给出具体答案了。

    一般来说,这种都是序列化之后的一个ID,但是既然放在前端,就会有生成规则。

    看描述,应该是当前页面返回的值中,会生成一些代码,然后这些代码序列化为这个ID,然后后端会验证这个ID,防止无脑爬虫。

    想要越过也简单,一般来说,这种ID都是通用的方法,通常会类似cookie的方式,你要做的就是,每次在访问页面的返回值里面,解析出来这个ID(考虑正则,拼接等方式,从页面能找到答案的),然后在搜索的时候放在formdata的javax.faces.ViewState中。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 8月6日

悬赏问题

  • ¥15 网络科学导论,网络控制
  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?
  • ¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
  • ¥15 c#逐行读取txt文本,但是每一行里面数据之间空格数量不同
  • ¥50 如何openEuler 22.03上安装配置drbd
  • ¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
  • ¥15 无线连接树莓派,无法执行update,如何解决?(相关搜索:软件下载)