weixin_38752686 2021-03-10 18:29 采纳率: 100%
浏览 50
已结题

爬虫下载zcool网站上详情页内所有图片的url

网址:https://www.zcool.com.cn/discover/0!0!0!0!0!!!!2!-1!1

详情页1:https://www.zcool.com.cn/work/ZNTEyNTY2NzY=.html

详情页2:https://www.zcool.com.cn/work/ZNTA5NDA0NjA=.html

详情页1内的图片已经全部加载,所以只需要解析该详情页

详情页2内的图片没有全部加载,需要通过访问https://www.zcool.com.cn/work/content/show?p=2&objectId=12735115,然后通过json转化,才能获取到想要的数据。

我想”https://www.zcool.com.cn/work/content/show?p=2&objectId=“+“详情页1的id”,得到的是没有用的json数据。

所以,详情页1和详情页2都在网址请求页的同一页上,如果想爬取同一页的详情页的完整的图片url该怎么做?

 

  • 写回答

2条回答 默认 最新

  • 天际的海浪 2021-03-10 19:00
    关注

    这个是分页加载的。
    https://www.zcool.com.cn/work/content/show?p=2&objectId=12735115
    地址中 p=2 是页数。详情页1的数据只有一页没有第二页,p应该是 p=1
     

    评论

报告相同问题?

悬赏问题

  • ¥50 微信聊天记录备份到电脑提示成功了,但还是没同步到电脑微信
  • ¥15 python怎么在已有视频文件后添加新帧
  • ¥20 虚幻UE引擎如何让多个同一个蓝图的NPC执行一样的动画,
  • ¥15 fluent里模拟降膜反应的UDF编写
  • ¥15 MYSQL 多表拼接link
  • ¥15 关于某款2.13寸墨水屏的问题
  • ¥15 obsidian的中文层级自动编号
  • ¥15 同一个网口一个电脑连接有网,另一个电脑连接没网
  • ¥15 神经网络模型一直不能上GPU
  • ¥15 pyqt怎么把滑块和输入框相互绑定,求解决!