weixin_44645285 2019-02-08 23:49 采纳率: 0%
浏览 487

JSoup获取html源码显示不同怎么获取图二中的内容?

想要获取图二字符串该怎么做?

图一 起点页面显示为
图片说明

图二为 查看源代码出现的html实体
图片说明

图三为程序中获取到输出的内容

图片说明

代码如下:

public static void main(String[] args) throws IOException, DataFormatException {
        Document jsoup = Jsoup.parse(new URL("https://book.qidian.com/info/1013414929"),999999);
        Elements bookinfo = jsoup.select(".book-info p em span");
        String webclass = null;
        for(int i = 0,len = bookinfo.size();i<len;i++) {
            webclass = bookinfo.get(i).attr("class");
            System.out.println(bookinfo.get(i));
        }
    }
  • 写回答

1条回答 默认 最新

  • threenewbee 2019-02-08 23:55
    关注

    JSoup获取html源码获取的只是初始的网页代码
    但是网页里有ajax脚本,在执行过程中可以动态加载一些内容,这个获取不到。

    你需要做的是,用浏览器f12的抓包功能看它异步加载了什么数据,然后照着去请求这些地址,获得加载的数据。

    评论

报告相同问题?

悬赏问题

  • ¥15 k8s部署jupyterlab,jupyterlab保存不了文件
  • ¥15 ubuntu虚拟机打包apk错误
  • ¥199 rust编程架构设计的方案 有偿
  • ¥15 回答4f系统的像差计算
  • ¥15 java如何提取出pdf里的文字?
  • ¥100 求三轴之间相互配合画圆以及直线的算法
  • ¥100 c语言,请帮蒟蒻写一个题的范例作参考
  • ¥15 名为“Product”的列已属于此 DataTable
  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题