n13709394 2018-09-29 15:30 采纳率: 0%
浏览 1974

如何用Jsoup爬取网址中懒加载的图片地址?

RT,最近学习用Jsoup爬取极客公园网站的数据,但发现用这个开源库只能爬取到静态的数据,像是首页新闻的图片和作者的头像不能够爬取出来,想问下大神怎么爬取动态加载后的数据呢?
网址: https://www.geekpark.net/
想爬取的数据: 新闻列表下的文章图片和作者头像的信息,发现待爬图片网址的属性是 lazy="loaded",在网页的操作是,当网页请滑到相应的位置时,对应的图片加载出来。
不知道这个是不是动态的数据,请大神指导,谢谢!!

想爬取网址的截图如下
想获取的两个图片链接

用Jsoup获取到的document

  • 写回答

1条回答

  • fish_dream 2018-09-30 02:57
    关注

    看一下视频教程,
    有一个获取评论数的视频,对于这样的爬取还要在转化一次才行。

    评论

报告相同问题?

悬赏问题

  • ¥15 django项目运行报编码错误
  • ¥15 请问这个是什么意思?
  • ¥15 STM32驱动继电器
  • ¥15 Windows server update services
  • ¥15 关于#c语言#的问题:我现在在做一个墨水屏设计,2.9英寸的小屏怎么换4.2英寸大屏
  • ¥15 模糊pid与pid仿真结果几乎一样
  • ¥15 java的GUI的运用
  • ¥15 我想付费需要AKM公司DSP开发资料及相关开发。
  • ¥15 怎么配置广告联盟瀑布流
  • ¥15 Rstudio 保存代码闪退