n13709394 2018-09-29 15:30 采纳率: 0%
浏览 1974

如何用Jsoup爬取网址中懒加载的图片地址?

RT,最近学习用Jsoup爬取极客公园网站的数据,但发现用这个开源库只能爬取到静态的数据,像是首页新闻的图片和作者的头像不能够爬取出来,想问下大神怎么爬取动态加载后的数据呢?
网址: https://www.geekpark.net/
想爬取的数据: 新闻列表下的文章图片和作者头像的信息,发现待爬图片网址的属性是 lazy="loaded",在网页的操作是,当网页请滑到相应的位置时,对应的图片加载出来。
不知道这个是不是动态的数据,请大神指导,谢谢!!

想爬取网址的截图如下
想获取的两个图片链接

用Jsoup获取到的document

  • 写回答

1条回答 默认 最新

  • fish_dream 2018-09-30 02:57
    关注

    看一下视频教程,
    有一个获取评论数的视频,对于这样的爬取还要在转化一次才行。

    评论

报告相同问题?

悬赏问题

  • ¥15 这个电路是如何实现路灯控制器的,原理是什么,怎么求解灯亮起后熄灭的时间如图?
  • ¥15 matlab数字图像处理频率域滤波
  • ¥15 在abaqus做了二维正交切削模型,给刀具添加了超声振动条件后输出切削力为什么比普通切削增大这么多
  • ¥15 ELGamal和paillier计算效率谁快?
  • ¥15 file converter 转换格式失败 报错 Error marking filters as finished,如何解决?
  • ¥15 ubuntu系统下挂载磁盘上执行./提示权限不够
  • ¥15 Arcgis相交分析无法绘制一个或多个图形
  • ¥15 关于#r语言#的问题:差异分析前数据准备,报错Error in data[, sampleName1] : subscript out of bounds请问怎么解决呀以下是全部代码:
  • ¥15 seatunnel-web使用SQL组件时候后台报错,无法找到表格
  • ¥15 fpga自动售货机数码管(相关搜索:数字时钟)