JSOUP 怎么获取网站内容？求助！

在爬一个金融类网站的数据的时候发现jousp获取的html里面居然有个div是空的

图片说明

然而在chrome的后台看，我需要的数据都在这个div里，求大神解释这是什么情况！

图片说明

CSDN上的这个帖子https://bbs.csdn.net/topics/392361731 的问题是一样的，但是看了底下的回答实在是太模糊了，没有提出解决方法

附上源码：
import java.io.IOException;
import java.util.Map;

import org.jsoup.*;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

class Main {
private String loginURL =
private String WebURL =

private Map<String, String> loginCookies = null;
private static Document document = null;

public static void main(String[] args) {
    Main This = new Main();
    try {
        This.bypassLogin();
        This.getDocument();
    }catch (IOException e){
        System.out.println(e);
    }

    if(document!=null) {
        System.out.println("Document accessed!");
        System.out.println(document.toString());
        This.getContent();
    }else{
        System.out.println("Document not accessed!");
    }

    System.out.println("Program Ended");

}

private void getContent(){
    Element content = document.select("span.stock-yellow").first();
    System.out.println(content.toString());
}

private void getDocument() throws IOException{
    if (loginCookies!=null){
        document = Jsoup.connect(WebURL)
                .cookies(loginCookies)
                .userAgent("Mozilla/5.0 (Windows; U; WindowsNT 5.1; en-US; rv1.8.1.6) Gecko/20070725 Firefox/2.0.0.6")
                .referrer("www.google.com")
                //.ignoreHttpErrors(true)
                .maxBodySize(0)
                .get();
    }else{
        System.out.println("Login Cookies is NULL");
    }
}

private void bypassLogin() throws IOException {
    Connection webConnection = Jsoup.connect(loginURL);

    webConnection.header("Accept", "*/*").header("Accept-encoding", "gzip,deflate,br");
    webConnection.header("Accept-language", "en,zh-CN,q=0.9,zh;q=0.8").header("Connection", "keep-alive");
    webConnection.header("Content-length", "526").header("Content-Type", "application/x-www-form-urlencoded; charset=UTF-8");
    webConnection.header("DNT", "1").header("HOST", "www.12345fund.com");
    webConnection.header("Origin", "/*马赛克*/").header("Referer", "www.google.com");
    webConnection.header("User-Agent", "ozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36");
    webConnection.header("X-Requested-With", "XMLHttpRequest");

    webConnection.data("account_name", "/*马赛克*/")
            .data("autologin", "1")
            .data("terminal_id", "/*马赛克*/")
            .data("is_phone", "false")
            .data("browser", "Chrome")
            .data("browser_code", "Mozilla")
            .data("browser_name", "Netscape")
            .data("browser_version", "5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36")
            .data("browser_hardware_platform", "Win32")
            .data("browser_user_agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36")
            .data("passwordmd5", "/*马赛克*/");

    Connection.Response res = webConnection.ignoreContentType(true).method(Connection.Method.POST).execute();

    loginCookies = res.cookies();
}

}

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
zqbnqsdsmd 2019-09-09 20:16
关注
http://www.mamicode.com/info-detail-1568320.html

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

急！请问java的jsoup爬虫如何完整获得响应验证码？ java 开发语言爬虫
2022-04-21 11:40

回答 2 已采纳代码抛了异常，后面的代码没有执行。try catch 下抛出异常的代码试下。
Android手机无法使用jsoup，如何解决？(语言-java|开发工具-eclipse) android eclipse java
2022-06-20 16:42

回答 1 已采纳 implementation 'org.jsoup:jsoup:1.14.3' 用的是这个开源包吗？
jsoup不能获取html的全部内容？ java java-ee linux 开发语言
2019-02-24 15:17

回答 3 已采纳已经解决了，是因为网站有反爬机制的。。。
Java jsoup table 中获取td和tr的值
2020-06-19 16:02

Super_King_的博客由于公司最近需要接一下前端table的数据然后解析出来再循环生成表格数据，或者替换表格里的变量，我就来万能的百度求助了，特此记录例：html中的内容为 <table> <tr> <td>user</td> ...
关于 java 利用jsoup爬取图片的问题？ java 爬虫
2023-02-13 14:54

回答 3 已采纳每个网站的数据请求方式可能不一样，甚至有些网站不让下载，能够检测到不是人工下载。你可以手动打开那个不能下载的url，复制到浏览器上打开看能否正常显示，其次url是否发生了变化。望采纳！！
java通过jsoup怎么爬取动态加载的内容 java
2018-04-10 08:23

回答 3 已采纳 https://blog.csdn.net/a812919698/article/details/52243080
java jsoup怎么获取最后一个html里的a标签 html5
2015-10-11 02:25

回答 2 已采纳循环获得最大下标的
java jsoup 乱码,Java JSOUP 连接超时问题及乱码问题求助
2021-04-17 04:40

硬核大卫哥的博客问题 1：已经设置了超时时间为 30 秒且 JSOUP 默认超时时间为 30S，为什么输出的超时时间是 20 秒问题 2：IDEA 已经加了 JVM 参数 && gradle 也加了 UTF-8 的编译方式，为什么还是会有乱码？且并不是全乱码...
Jsoup中获取已知元素的父元素开发语言
2019-05-15 23:48

回答 2 已采纳 ``` String html=""; Document doc = Jsoup.parse(html); Element ele = doc.getElementById("33")
java中使用jsoup获取cookies
2012-08-20 17:31

回答 1 已采纳执行followRedirects(false) 不进行重定向： [code="java"] /** * Configures the request to (no
JSoup登录网站并访问 java php
2016-10-02 07:38

回答 1 已采纳 There are some points to correct: the login endpoint is not correct (the correct one is http://w
计算机设计大赛参赛作品——疫情看板
2021-04-24 20:49

索半斤_suobanjin的博客集体或个人可向网站提交求助信息，由网站后台审核后发布于“疫互助”平台，由帮助者对其提供帮助，便于疫情物资及时调配，使物资分配何使用最优化、最大化。网站“疫导航”模块通过整合官方的疫情信息查询平台使...
java jsoup Elements方法查看href里是否有想要的值 java
2015-10-09 05:48

回答 2 已采纳 elem.attr("abs:href").endsWith("p.html")|| elem.attr("abs:href").endsWith("pr.html")
webmagic采集CSDN的Java_WebDevelop页面
2016-05-23 09:53

小扁加油的博客使用webmagic采集博客类的网站示例
一次接口联调的经历
2021-09-23 14:31

低代码布道师的博客思前想后，不能总卡在原点吧，还好以前和这个原厂商的经理合作过，卑微求助吧但是合作伙伴比较忙，隔了一周才抽出空来，于是他拉了个群，我在群里说了一下症状，对方很快给出了解决方案，测试了一下，终于通了卡...
爬虫
2017-09-07 00:45

Eayonchen的博客求助!如何用多线程和队列优化爬虫?
nodejs如何将数据返回到html,html5,node.js_如何用nodejs接收GPS发送的数据，并实时返回前台页面，html5,node.js,javascript - phpStudy...
2021-06-13 04:01

赵bin的博客 2、用nodejs写一个后台，获取GPS发送的坐标信息。3、使用nodejs中的socket.io包结合html5的websocket把数据实时的返回到前台页面，然后再在前台页面展示GPS数据。开发环境：使用TCP/UDP Socket调试工具模拟GPS发送...
没有解决我的问题, 去提问

悬赏问题

¥15 如何实验stm32主通道和互补通道独立输出
¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题

JSOUP 怎么获取网站内容？求助！

3条回答 默认 最新

悬赏问题

3条回答默认最新