jsoup不能获取html的全部内容？

我用

Document doc=Jsoup.connect("http://www.baidu.com").get();
System.out.println(doc);

只能得出js代码，如图所示：

但是却可以通过doc.getElementById("ul"); 获取里面的标签值。
这是怎么回事呢？？

然后我用

// 将string转成url对象
            URL realUrl = new URL(url);
            URLConnection connection = realUrl.openConnection();
            connection.connect();
            in = new BufferedReader(new InputStreamReader(connection.getInputStream(),"utf-8"));
            String line;
            while ((line = in.readLine()) != null) {
                result += line;
            }

这种方式可以获取到网页所有的html代码。

哪位大神能给小弟指点下怎么回事？谢谢啦。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
xfjjs江城子 2019-04-25 23:15
关注
已经解决了，是因为网站有反爬机制的。。。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

基于Jsoup库的HTML网页内容解析与展示设计源码
2024-10-05 03:35

2. Java编程语言基础，包括Java的类、方法、控制流等基本概念； 3. XML文件的处理，理解XML文件结构及其在项目中的作用； 4. 图片资源的处理，项目中包含的PNG图片可能用于网站的UI设计或者信息展示； 5. Java JAR包...
Java爬虫Jsoup+httpclient获取动态生成的数据
2020-10-19 21:21

本文主要讲述如何利用Java编程语言中的Jsoup库和HttpClient工具包来获取和解析动态生成的数据，特别是那些通过JavaScript动态加载的数据。 ### Java爬虫基础 Java爬虫是指使用Java语言编写的一类程序，这些程序...
Java中使用开源库JSoup解析HTML文件实例
2020-10-25 09:58

Java是一种广泛使用的面向对象的编程语言，它在互联网技术中占据了非常重要的地位。当开发涉及处理HTML文档的应用程序时，Java程序员常常需要解析HTML文件，提取信息或修改内容。然而，标准的Java开发工具包(JDK)并...
华尔街见闻实时数据抓取工具_单线程与多线程网络爬虫实现_用于金融数据采集与分析_Java编程语言实现通过HttpClient库发送请求Jsoup解析HTML页面内容Execu.zip
2025-08-28 15:45

在Java编程语言的实现中，工具的编写者利用了Java的多线程机制，这样不仅可以提高爬虫的工作效率，还能在遇到需要频繁网络交互的应用场景下，保持较低的响应延迟。此外，多线程编程可以更好地利用现代多核处理器的...
Java 使用jsoup解析Html
2024-08-09 03:43

CellMax的博客在当今的网络编程中，解析 HTML 是一个非常常见的需求，尤其是在数据抓取（Web Scraping）和解析网页内容等场景中。Java 提供了许多工具和库，其中 Jsoup 是一个流行的库，用于处理和解析 HTML 文档。本文将详细介绍...
html-crawler.zip_in_org.jsoup.Jsoup
2022-09-20 22:17

HTML Crawler是一个基于Java编程语言实现的网页抓取程序，主要利用了Jsoup库来解析和提取HTML文档中的数据。Jsoup是Java中一个非常强大的库，它允许开发者以一种结构化、易于理解的方式来处理HTML内容，使得网页抓取...
Jsoup解析html(1)
2024-04-19 16:06

2401_84097510的博客 javascript是前端必要掌握的真正算得上是编程语言的语言，学会灵活运用javascript，将对以后学习工作有非常大的帮助。掌握它最重要的首先是学习好基础知识，而后通过不断的实战来提升我们的编程技巧和逻辑思维。这一...
java html 替换元素,使用Jsoup提取HTML元素，修改HTML内容
2021-04-17 03:23

燕麦麦的博客 Jsoup是一个开源的，专门处理HTML内容的强大工具，下载地址+中文文档地址：http://www.open-open.com/jsoup/。最初开始使用时，由于对网页前端知之甚少，并未感受到Jsoup在编程中处理web的强大。最近几次帮同学写小...
基于Java的实例开发源码-HTML解析器 jsoup.zip
2023-06-17 15:28

在标签"java"和"软件/插件"下，我们可以理解jsoup是一个Java编程语言中的软件组件，它可以被集成到各种Java应用中，如Web爬虫、数据分析工具或者需要处理HTML内容的服务端应用。而"html"标签表明了jsoup的主要工作...
jsoup解释html的script,jsoup-处理html中的script数据
2021-06-14 01:26

Kang He的博客所有的编程语言,包括 JavaScript,对浮点型数据的精确度都很难确定: Java WEB中的HttpServletResponse数据传递 1.什么是HttpServletResponse 2.使用HttpServletResponse向浏览器发送数据及相关实例. 实例1:实现文件...
java使用Jsoup组件生成word文档
2020-10-26 17:11

Java作为一种广泛使用的编程语言，在处理这类任务时非常高效。本文将详细介绍如何利用Java结合Jsoup组件来生成Word文档，特别关注在处理HTML内容时遇到的一些常见问题及其解决方案。 #### 二、Jsoup组件简介 Jsoup...
spring boot+java +jsoup+ 爬虫
2022-03-30 22:11

Java 作为后端编程语言，因其性能稳定、跨平台性以及丰富的库支持而被广泛应用于爬虫开发。Java的HttpURLConnection或者Apache HttpClient库可用于发送HTTP请求，获取网页内容。在此项目中，Java是实现爬虫逻辑的...
使用Jsoup提取HTML元素，修改HTML内容
2014-02-22 15:58

Futureer的博客 Jsoup是一个开源的，专门处理HTML内容的强大工具，下载地址+中文文档地址：http://www.open-open.com/jsoup/。最初开始使用时，由于对网页前端知之甚少，并未感受到Jsoup在编程中处理web的强大。最近几次帮同学写小...
Jsoup
2020-11-07 00:03

Java知识日历的博客神器介绍今天我要介绍一款操作Html文档非常好用的Java插件，强烈安利！因为实在太好用了！“Jsoup 是一款纯Java实现，可以非常方便读取和操作Html文档的一款插件。她的API跟...
使用Jsoup库进行Java操作HTML标签实战指南
2025-05-12 18:07

屁伦的博客 Jsoup的主要功能包括但不限于：从URL、文件或字符串解析HTML： Jsoup可以处理来自不同来源的HTML，包括网络上的网页和本地的HTML文件。提取和操作数据：使用选择器，类似于jQuery，Jsoup可以轻松地提取和操作HTML...
java源码：HTML解析器 jsoup.rar
2021-10-13 14:58

3. 清理和规范化HTML：jsoup提供了一种安全的方式来清理不完整的或潜在有害的HTML，使其符合标准，同时保留其结构和内容。 4. 数据提取：通过DOM遍历和选择器，jsoup可以方便地提取HTML中的数据，如文本内容、属性...
JAVA jSOUP解析html
2015-08-04 17:48

Java作为一门广泛应用的编程语言，提供了多种库来处理这项工作，其中之一就是jSoup。本篇将详细介绍jSoup库在Java中解析HTML的相关知识点，并通过提供的`Test01.java`和`UrlUtils.java`两个文件名推测可能的实现方式...
没有解决我的问题, 去提问

jsoup不能获取html的全部内容？

3条回答 默认 最新

3条回答默认最新