有Java爬虫大佬帮我看下这个是哪里错了怎么运行不出来呢。谢谢啦，运行结果在下面，也有示例代码！

有Java爬虫大佬帮我看下这个是哪里错了怎么运行不出来呢。谢谢啦，

看不到哪里错了就是运行不出来，，

代码如下：

package Cho;

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileOutputStream;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.net.URL;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Demo1 {
	private static final String i = null;

	public static void main(String[] args, boolean isEX) {
		//根据小说存在位置的file对象
		File file=new File("D:\\pachong\three_gou.txt");
		//2.根据网页的结构编写正则，创建pattern对象
		String regex_content="<p.*?>(.*)</p>";
		String regex_title="<title>(.*?)</title>";
		Pattern p_content=Pattern.compile(regex_content);
		Pattern p_title=Pattern.compile(regex_title);
		
		Matcher m_content;
		Matcher m_title;
		//3.编写循环,创建向所有小说章节页面发起网络请求的url对象
		for(int i=0;i<=10;i++)
		System.out.println("第"+i+"章开始下载。。。");
		try {
			//创建每一个页面的url对象
			URL url=new URL("http://www.purepen.com/sgyy/"+i+".htm");
			//创建网络读取流
			BufferedReader reder=new BufferedReader(new InputStreamReader(url.openStream(),"utf8"));
			//读取网络内容
			String  str=null;
			
			//创建输入流
			BufferedWriter writer=new BufferedWriter(new OutputStreamWriter(new FileOutputStream(file,true)));
			
			while((str=reder.readLine())!=null){
				m_title=p_title.matcher(str.toString());
				m_content=p_content.matcher(str.toString());
				//获取小说标题写入来本地文件
			boolean ieEx=	m_title.find();
				if(isEX){
					String title =m_title.group();
					//清洗得到数据
					title =title.replace("<title>", "").replace("</title>", "");
			writer.write("第"+i+"章："+title+"\n");
				}
				while(m_content.find()){
					String content=m_content.group();
					//清洗的到的数据
					content=content.replace("<p>", "").replace("</p>", "").replace("&nbsp;", "").replace("?", "");
				//吧小说内容写入文件
					
				}
			}
			System.out.println("第"+i+"章下载完成。。。。。。");
			writer.write("\n\n");
			writer.close();//关闭
			reder.close();
		} catch (Exception e) {
			System.out.println("下载失败");
		}
		}
	}

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
何必要如此 2021-02-24 15:08
关注
按行读取不一定就符合你的正则标签是

<p>

xxxxxx

</p>你能匹配上吗

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

Java不适合做爬虫？试试这个工具！
2024-04-28 19:20

m0_61067876的博客工具的特点在于使用微内核与插件的不同组合架构，使得工具在扩展性上更强，使用及二次开发更灵活方面，同时对于一些初学者来说不需要额外的编写代码就可以直接使用，并且抽取页面数据的时候还可以以多线程来保证性能...
【Java】爬虫，看完还爬不下来打我电话
2019-07-12 15:34

midnight_time的博客简单的理解，比如您对百度贴吧的一个帖子内容特别感兴趣，而帖子的回复却有1000多页，这时采用逐条复制的方法便不可行。而采用网络爬虫便可以很轻松地采集到该帖子下的所有内容。网络爬虫的作用，我总结为以下几点...
爬虫大佬的必备技能，你会哪几个？
2023-12-19 18:03

白帽黑客艾登的博客当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理解，这些理解是比较独到，可以学到不一样的思路。Python所有方向的技术点做的...
爬虫代码成功运行完没有结果
2022-05-01 12:03

想学IT的经管菜鸟的博客这是我运行的代码，去爬图片，但试了好几次都不行，而且我电脑上有lxml这个程序包啊，请教各位大佬该怎么解决。 import requests from lxml import etree from urllib import request address = '...
java语言实现的WEB爬虫平台
2024-09-07 21:39

2401_86372554的博客 5、支持爬取JS动态渲染的页面6、支持代理7、支持二进制格式8、支持保存/读取文件(csv、xls、jpg等)9、常用字符串、日期、文件、加解密、随机等函数10、支持流程...建议使用5.7版本3、安装maven3.0服务二、运行项目。
【Java项目】讲讲我用Java爬虫获取LOL英雄数据与图片（附源码）_游戏数据抓取
2024-05-06 15:55

2401_84140754的博客 WebMagic的设计参考了业界最优秀的爬虫Scrapy，而实现则应用了HttpClient、Jsoup等Java世界最成熟的工具，目标就是做一个Java语言Web爬虫的教科书般的实现这是一个包含各大常用工具方法的Java工具包。里面具有丰富的...
python爬虫豆瓣返回的结果是中括号[],求解大佬
2021-07-06 14:45

青梦星河的博客
Selenium Java 自动化、爬虫
2022-07-22 10:36

ixm0829的博客 Selenium是一款非常强大的Web应用程序测试的工具，由于自己需要这块的需求所以简单学习了一下。以下输出的文档有参考官方文档以及几位大佬的博客而输出出来的，仅用于学习参考；
我hook定位使程序重启的so文件时为啥子会报这样的错，有没有大佬解答一下啊
2025-05-21 17:45

a927115417的博客 [看这里]: /system/lib64/arm64/nb/libtcb.so。// Hook android_dlopen_ext 函数。// 在函数返回时可以进行额外的操作。// 在函数返回时可以进行额外的操作。// 获取路径参数并转换为字符串。// 获取路径参数并转换...
python爬虫运行linux_Python 爬虫部署 Linux
2020-12-06 11:03

weixin_39621819的博客还没看过的同学可以先看一下，这只爬虫主要用来爬取各个博客平台的阅读量等数据，一直以来都是每天晚上我自己手动在本地电脑运行，中间也有过几次忘记运行了，导致没有当天的统计数据。当然最好的办法就是把这只爬虫...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 7月25日

有Java爬虫大佬帮我看下这个是哪里错了怎么运行不出来呢。谢谢啦，运行结果在下面，也有示例代码！

4条回答 默认 最新

问题事件

4条回答默认最新