Lazulitecn 2021-04-10 11:21 采纳率: 84.8%
浏览 351
已结题

Python爬虫遇到 javax.faces.ViewState这个类似ID号的Form怎么处理呢?

POST查询信息的formdata有这个key,value是个类似序号ID的内容,单个有时效,而且会变,关闭查询页面后ID值会+1,但是直接在爬虫里将ID循环+1后查询结果为空,或者一直使用同一个ID号,但是到后面锁查询的信息就不会更新了。

现在我是每次查询都重新登录一次帐号,因为登陆后的序号是固定的,但是现在需要连续查询多个内容,效率太低了,请问该怎么处理呢?

  • 写回答

1条回答 默认 最新

  • 漠上刀栈 2021-04-10 11:29
    关注

    你这个描述,很难给出具体答案了。

    一般来说,这种都是序列化之后的一个ID,但是既然放在前端,就会有生成规则。

    看描述,应该是当前页面返回的值中,会生成一些代码,然后这些代码序列化为这个ID,然后后端会验证这个ID,防止无脑爬虫。

    想要越过也简单,一般来说,这种ID都是通用的方法,通常会类似cookie的方式,你要做的就是,每次在访问页面的返回值里面,解析出来这个ID(考虑正则,拼接等方式,从页面能找到答案的),然后在搜索的时候放在formdata的javax.faces.ViewState中。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 8月6日

悬赏问题

  • ¥15 关于模型训练的一个问题
  • ¥15 装了几千台服务器从来没遇到这种问题,哎看下哪位帮我解决吧
  • ¥15 单片机程序上的困难问题
  • ¥15 请教某软件缓存Ts文件破解合并mp4的方法
  • ¥15 求小游戏炸弹人中关于敌人的C++代码
  • ¥15 拿到这个服务器最高权限有偿
  • ¥50 来个抓app跳转支付宝转链接的
  • ¥15 remotes安装提示没有description文件
  • ¥15 AttributeError: 'NoneType' object has no attribute 'drop_duplicates'报错
  • ¥15 以下代码,运行结果报错