利用jsoup爬取网站图片,
//imgStr为图片的url
Connection.Response response = Jsoup.connect(imgStr).userAgent("Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36 Edg/108.0.1462.76")
.ignoreContentType(true).execute();
//调用下载
loadImg(response.bodyAsBytes());
图片下载本地
public void loadImg(byte[] bt) throws IOException {
String imgName ;
SimpleDateFormat df = new SimpleDateFormat("yyyyMMddHHmmss");//设置日期格式
imgName = df.format(new Date()) +".jpg";
ByteArrayInputStream stream = new ByteArrayInputStream(bt);
FileUtils.copyInputStreamToFile(stream, new File("D://picture2//"+ imgName ));
System.out.println("下载完成");
}
可是下载的图片时损坏状态。于是我用notepad+将损坏图片打开,发现竟然时html代码。
有的网站用上面的代码是可以下载图片,但是有的网站就会遇到上面的问题。
我想问一下这是哪里出了问题,该怎么解决?