Java语言高分悬赏：怎么提取百度新闻的标题到一个文本文件，可以使用httpclient的方法

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

Z_墨脱 2020-04-27 17:34

关注

public class News {
public static void main(String[] args) throws ClientProtocolException, IOException {
// 创建HttpClient实例
CloseableHttpClient httpClient = HttpClients.createDefault();
// 创建httpget实例
HttpGet httpGet = new HttpGet("https://news.baidu.com/");

    RequestConfig config = RequestConfig.custom()
            .setConnectTimeout(10000)//设置连接超时时间10秒钟，单位毫秒
            .setSocketTimeout(10000) //设置读取超时时间10秒钟
            .build();
    httpGet.setConfig(config);
    // 设置请求头消息User-Agent模拟浏览器
    httpGet.setHeader("User-Agent", "Mozilla/5.0 (Windows NT 6.1; W…) Gecko/20100101 Firefox/59.0");
    // 执行get请求
    CloseableHttpResponse response = httpClient.execute(httpGet);
    // 获取返回实体
    HttpEntity entity = response.getEntity();
    // 实体的内容（编码格式为utf-8）
    String content = EntityUtils.toString(entity, "utf-8");
    // System.out.println("网页内容为： " + content);

    // 解析网页 得到文档对象
    Document doc = Jsoup.parse(content);    

    Elements hrefElements = doc.select("a[href]");// 选择所有的a元素
    for (Element e : hrefElements) {
        System.out.println("新闻标题：" + e.text());
        System.out.println("新闻地址：" + e.attr("href"));
        System.out.println("------------------------");
    }

}

}

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

Java通过HttpClient实现请求接口发送文件
2022-02-22 08:00

一恍过去的博客 Java通过HttpClient实现请求接口发送文件
java中HttpClient使用【含例子】
2024-05-03 21:17

一口酥Hac的博客通过HttpRequest对象，您可以设置请求的URL、请求方法、请求头、请求体等信息，并构建一个完整的HTTP请求对象，用于发送给服务器。它提供了一种简单且一致的方式来执行HTTP操作，包括同步和异步的请求发送、连接池...
HttpClient 使用 Post 方法传输文件
2022-03-18 09:04

菠萝蚊鸭的博客 HttpClient 使用 Post 方法传输文件
java.net.SocketException: Connection reset 异常原因分析和解决方法
2025-01-12 11:43

初夏0811的博客方法一：如果客户端JDK是1.7，服务器端要求TLSv1.2，那么在启动参数加上-Dhttps.protocols=TLSv1.2即可。**解决方法：**服务器端和客户端使用相同的连接方式，即同时使用长连接或短连接。**解决方法：**服务器端和...
Java语言HttpClient使用代理IP
2019-12-19 10:01

地表最强菜鸡的博客在访问一个网站时，有时我们不想让对方获取到我们的真实IP，这种情况下，就可以使用代理IP进行访问。 1、maven依赖 <dependency> <groupId>org.apache.httpcomponents</groupId> <...
Java httpclient请求form-data格式，并设置boundary代码实现
2024-07-27 16:52

Mr.Java.的博客本文将教会你使用Java正确的借助Apache HttpClient实现请求form-data格式，正确的是设置Content-type中的boundary。
【java11】java11新特性之标准HttpClient
2024-06-03 14:15

morris131的博客异步和流式处理：HttpClient支持...支持WebSocket：HttpClient支持WebSocket通信，使得在Java应用程序中实现实时通信变得更加容易。定制化：HttpClient允许用户根据需要自定义请求和响应的处理方式，提供更大的灵活性。
Java 的 HttpClient 中使用 POST 请求传递参数
2025-02-23 21:24

＋720的博客在 Java 的 HttpClient 中，如果使用 POST 请求传递参数，有两种常见方式：通过请求体传递（通常是 JSON 或 XML 格式，适用于 RPC）。通过表单参数传递（类似于 HTML 表单提交，使用键值对）。由于你提到的是 RPC...
使用httpclient上传文件
2022-05-25 15:14

馍馍菜的博客使用httpclient工具请求接口上传文件和相关数据
Java使用HttpClient上传文件
2018-06-28 10:19

hadbestman的博客上传所用httpclient版本为4.5.1客户端：/** * 模拟表单上传文件 * postFile 上传的文件 * postUrl 请求地址 * postParam 其他表单的请求参数 */ public static Map<String,Object> ...
没有解决我的问题, 去提问

码龄粉丝数原力等级 --

Java语言高分悬赏：怎么提取百度新闻的标题到一个文本文件，可以使用httpclient的方法

2条回答默认最新

码龄粉丝数原力等级 --

Java语言高分悬赏：怎么提取百度新闻的标题到一个文本文件，可以使用httpclient的方法

2条回答 默认 最新

2条回答默认最新