java怎么解析网页，下载里面的图片

开门见山，先说需求：获取一个网页的源码，然后解析对应的图片地址，最后将图片下载到本地

网页：点击直达
需要下载的图片所在的地方：

将上图中

元素里的图片（大概有一百多张）下载到本地，下载不要使用多线程，太快怕锁ip。请问该怎么做？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

pzzhao 2023-03-03 19:49

关注

该回答引用自ChatGPT

根据你的使用场景修改了下，你可以试试。我自己试着是好使的

Java可以使用Jsoup库来解析HTML源码，然后通过正则表达式或者CSS选择器来获取图片地址。最后使用Java的IO流将图片下载到本地。
下面是一个简单的Java爬取图片的示例代码：

import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.URL;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class ImageCrawler {
    public static void main(String[] args) throws IOException {
        String url = "https://pvp.qq.com/web201605/item.shtml";
        String saveFolder = "D:\\Temp";
        Document doc = Jsoup.connect(url).get();
        Elements imgs = doc.select("img[src~=(?i)\\.(png|jpe?g|gif)]");
        for (Element img : imgs) {
            try {
                String imgUrl = img.attr("src");
                if (imgUrl == null || imgUrl == "") {
                    continue;
                }
                if (!imgUrl.startsWith("http")) {
                    imgUrl = "https:" + imgUrl;
                }
                downloadImage(imgUrl, saveFolder);
                System.out.println("Image " + imgUrl + " downloaded.");
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
    private static void downloadImage(String imgUrl, String saveFolder) throws IOException {
        URL url = new URL(imgUrl);
        InputStream in = url.openStream();
        String fileName = imgUrl.substring(imgUrl.lastIndexOf("/") + 1);
        FileOutputStream out = new FileOutputStream(saveFolder + fileName);
        byte[] buffer = new byte[1024];
        int length = 0;
        while ((length = in.read(buffer)) != -1) {
            out.write(buffer, 0, length);
        }
        in.close();
        out.close();
    }
}

这个示例代码中，首先使用Jsoup库获取指定网页的HTML源码，然后使用CSS选择器来获取所有的图片元素。接着遍历每个图片元素，获取其src属性值作为图片的地址。最后通过Java的IO流将图片下载到本地。在实际使用中，需要根据具体情况进行修改和优化。

jsoup pom 依赖

<dependency>
    <groupId>org.jsoup</groupId>
    <artifactId>jsoup</artifactId>
    <version>1.14.1</version>
</dependency>

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

报告相同问题？

关注问题

Netty实战专栏 | Java网络编程深入解析
2023-11-02 10:48

geocodingcoder的博客大家好，我是Leo哥，本次专栏学习Java并发以及netty应用的深度学习，netty提供了异步、事件驱动、非阻塞的网络编程模型，能够轻松处理高并发、高吞吐量的网络通信场景。是一个基于的高性能网络应用框架。但是在此...
【JAVA入门】基础知识(语言概述）
2024-07-13 13:02

Pluton_QAQ的博客不仅如此，Java开发环境远远超出大多数其他编程语言的开发环境。 2. 面向对象什么是面向对象？在Java的世界里，一切皆对象。比如：人、狗、手机、电脑等都是对象。所谓面相对象，就是依靠对象之间的交互来完成...
一：Java语言概述
2021-02-01 21:15

程序员卖剩鸭的博客文章目录01、软件开发介绍1.1、常用的DOS命令02、计算机编程语言介绍03、 Java语言概述3.1、Java简史3.2、Java技术体系平台04、 Java程序运行机制及运行过程4.1、Java两种核心机制05、Java语言的环境搭建06、开发...
Java语言概述
2020-02-17 22:18

Tomcatist的博客第一章、Java语言概述 Java知识图解 Java基础课程体系第1章 Java语言概述第2章基本语法第3章数组第4章面向对象编程(上) 第5章面向对象编程(中) 第6章面向对象编程(下) 第7章异常处理第8章枚举类&...
java图片爬虫
2017-08-16 22:39

【Java图片爬虫】是一种利用Java编程语言实现的网络爬虫技术，专门用于抓取互联网上的图片资源。在这个项目中，开发人员使用了名为crawl4j的开源库，这是一个为Java设计的简单易用的Web爬虫框架。crawl4j允许开发者...
5屏圆角Flash图片滚动展示.zip_Java_
2021-08-09 23:18

2. **ActionScript**：ActionScript是Flash开发中使用的编程语言，用于控制动画和交互。虽然标签中没有明确提到，但`scroll.fla`是Flash的源文件，里面很可能包含了ActionScript代码来实现图片的动态滚动效果和圆角...
2022计算机Java二级考试四十五套题真题【收藏版】（一周裸考计划）
2020-11-27 10:42

张国荣家的弟弟的博客再网上看了很多的java面试题，有很多都是零零碎碎的，有或者是需要付费加密????的，加个vip什么的，故而以下是博主整理的有关java面试题的以下内容，我想以一种幽默风趣????的风格来给大家分享和探讨。另外附加有...
java项目之都市供求信息网.rar
2024-03-23 19:13

【标签】"Java毕设"表明该项目是作为Java编程语言学习者的毕业设计项目，通常这类项目会涉及到Java的基础语法、面向对象编程、异常处理、IO流、集合框架等核心知识点。"Java"标签则强调了项目的技术栈，Java是广泛...
深入解析Java线程池的扩容机制与拒绝策略
2024-01-09 00:23

极客李华的博客深入解析Java线程池的扩容机制与拒绝策略 Java线程池是多线程编程中一项重要的工具，它能够有效地管理和调度线程，提高程序的并发性能。线程池的扩容机制是线程池的关键特性之一，它允许根据工作负载的变化动态地...
B站---【狂神说Java】JavaWeb入门到实战---笔记
2020-04-23 18:59

夜里的雨的博客 ·web，网页的意思，www.baidu.com· 静态web 。html,sss 。提供给所有人看的数据始终不会发生变化！动态web 。淘宝，几乎是所有的网站；。提供给所有人看的数据始终会发生变化，每个人在不同的时间，不同的地点...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月3日

java怎么解析网页，下载里面的图片

开门见山，先说需求：获取一个网页的源码，然后解析对应的图片地址，最后将图片下载到本地

1条回答 默认 最新

问题事件

1条回答默认最新