Angel-Air-Here 2021-08-04 14:20 采纳率: 66.7%
浏览 23
已结题

python提取js下的图片数据怎么提取不到

目标网址:https://pic.netbian.com/tupian/27068.html

img

想要抓取该网站的原图数据,但是其隐藏在js中,登录后点击下载拿到原图url:https://pic.netbian.com/downpic.php?id=27068&classid=66。

img

img

发现挺简单,猜想将url中的id和classid修改一下就能下载别的原图,但是结果并不是我想的那样,为什么呀,求answer,下图是自己就是改了id和classid后得结果

img

并不是简单得改一下就能成功,然后就卡这了,再就是这个Initiator流程不咋会看;

img

这个是需要js解码吗很头疼,Confused!

  • 写回答

1条回答 默认 最新

  • 忍气吞声埋头苦干 2021-08-04 14:35
    关注

    img
    通过抓包可以看到,这个请求是点击下载后弹出来的一个请求。
    里面内容给了一个地址

    img

    可以分析出来,拼接完整的地址就可以下载到图片了,尝试用主域名拼接,success!成功
    img

    img
    你想通过修改id来改变下载的图片,是可行的,但是基于cookie模拟的登录状态和实际的登录账号是一样的。。。这个站点是有下载限制的,更多的我没办法测试。
    如有帮助,点个采纳。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 8月21日
  • 已采纳回答 8月13日
  • 创建了问题 8月4日

悬赏问题

  • ¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗?
  • ¥15 错误 LNK2001 无法解析的外部符号
  • ¥50 安装pyaudiokits失败
  • ¥15 计组这些题应该咋做呀
  • ¥60 更换迈创SOL6M4AE卡的时候,驱动要重新装才能使用,怎么解决?
  • ¥15 让node服务器有自动加载文件的功能
  • ¥15 jmeter脚本回放有的是对的有的是错的
  • ¥15 r语言蛋白组学相关问题
  • ¥15 Python时间序列如何拟合疏系数模型
  • ¥15 求学软件的前人们指明方向🥺