n13709394
n13709394
采纳率0%
2018-09-29 15:30

如何用Jsoup爬取网址中懒加载的图片地址?

RT,最近学习用Jsoup爬取极客公园网站的数据,但发现用这个开源库只能爬取到静态的数据,像是首页新闻的图片和作者的头像不能够爬取出来,想问下大神怎么爬取动态加载后的数据呢?
网址: https://www.geekpark.net/
想爬取的数据: 新闻列表下的文章图片和作者头像的信息,发现待爬图片网址的属性是 lazy="loaded",在网页的操作是,当网页请滑到相应的位置时,对应的图片加载出来。
不知道这个是不是动态的数据,请大神指导,谢谢!!

想爬取网址的截图如下
想获取的两个图片链接

用Jsoup获取到的document

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享
  • 邀请回答

1条回答

  • fish_dream fish_dream 3年前

    看一下视频教程,
    有一个获取评论数的视频,对于这样的爬取还要在转化一次才行。

    点赞 评论 复制链接分享

为你推荐