java.io.FileNotFoundException问题

package com.luceneheritrixbook.extractor.pconline.mobile;

import java.io.BufferedWriter;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.util.Date;

import org.htmlparser.Node;
import org.htmlparser.NodeFilter;
import org.htmlparser.filters.AndFilter;
import org.htmlparser.filters.HasAttributeFilter;
import org.htmlparser.filters.NotFilter;
import org.htmlparser.filters.OrFilter;
import org.htmlparser.filters.TagNameFilter;
import org.htmlparser.tags.ImageTag;
import org.htmlparser.tags.TableColumn;
import org.htmlparser.util.NodeList;

import com.luceneheritrixbook.extractor.Extractor;
import com.luceneheritrixbook.extractor.com163.Extract163Moblie;
import com.luceneheritrixbook.util.StringUtils;

public class ExtractPconlineMoblie extends Extractor {

public void extract() {
    BufferedWriter bw = null;
    //创建属性过滤器
    NodeFilter attributes_filter = new AndFilter(new TagNameFilter("td"),
            new OrFilter(new HasAttributeFilter("class", "td1"),new HasAttributeFilter("class", "td2")) );

    //创建标题过滤器
    NodeFilter title_filter = new TagNameFilter("h1");

/* NodeFilter title_filter = new AndFilter(new TagNameFilter("h1"),
new AndFilter(new HasAttributeFilter("class", "praameters"),
new NotFilter(new HasAttributeFilter("width"))));
*/

    //创建图片过滤器
    NodeFilter image_filter = new AndFilter( new TagNameFilter("img"),
            //                                  new HasAttributeFilter("class", "product-img"));
                new HasAttributeFilter("class", "bigimg"));

    //提取标题信息
    try {
        //Parser根据过滤器返回所有满足过滤条件的节点
        NodeList title_nodes = this.getParser().parse(title_filter);
        //遍历所有节点
        long num = title_nodes.size();
        for (int i = 0; i < title_nodes.size(); i++) {

            Node node_title=title_nodes.elementAt(i);
             //提取标题信息

            //TableColumn node = (TableColumn) title_nodes.elementAt(i);

            //用空格分割节点内部html文本
            String[] names = node_title.toPlainTextString().split(" ");
            StringBuffer title = new StringBuffer();
            //创建要生成的文本文件名
            for (int k = 0; k < names.length; k++) {
                title.append(names[k]).append("-");
            }
            title.append((new Date()).getTime());
            //创建要生成的文件

            String path = this.getOutputPath();

            bw = new BufferedWriter(new FileWriter(new File(path+title+".txt")));
            //获取当前提取页的完整URL地址
            int startPos = getInuputFilePath().indexOf("mirror") + 6;
            String url_seg = getInuputFilePath().substring(startPos);
            url_seg = url_seg.replaceAll("\\\\", "/");
            String url = "http:/" + url_seg;
            System.out.println(url);
            //写入当前提取页的完整URL地址
            bw.write(url + NEWLINE);
            for (int k = 0; k < names.length; k++) {
                bw.write(names[k] + NEWLINE);
            }               
        }
    } catch (Exception e) {
        e.printStackTrace();
    }
    //重置Parser
    this.getParser().reset();
    try {
        //Parser根据过滤器返回所有满足过滤条件的节点
        NodeList attributes_nodes = this.getParser().parse(attributes_filter);
        for (int i = 0; i < attributes_nodes.size(); i++) {
            //Parser根据过滤器返回所有满足过滤条件的节点      
            TableColumn node = (TableColumn) attributes_nodes.elementAt(i);

            String name = node.getAttribute("class");
            //提取属性名信息
            String result = node.toPlainTextString();

            if( name.equals( new String("td1") ))
            {
                bw.write(StringUtils.trim(result) + ":");           
            } else if( name.equals( new String("td2") ))
            {
                bw.write(StringUtils.trim(result) );    
                bw.newLine();                   
            }

// System.out.println(result);

            //提取属性值信息

// TableColumn nodeExt = (TableColumn) node.getNextSibling();

/*

//提取属性名信息
String result = getProp(
"

(.*)",
node.toHtml(), 1);
//属性里面包含有link标签的情况
if (result.indexOf("<") != -1)
result = getProp(
"(.*)",
node.toHtml(), 2);
//提取属性值信息
TableColumn nodeExt = (TableColumn) node.getNextSibling()
.getNextSibling();
*/

            continue;
        }
    } catch (Exception e) {
        e.printStackTrace();
    }
    //      重置Parser
    this.getParser().reset();
    try {
        //          Parser根据过滤器返回所有满足过滤条件的节点
            NodeList image_nodes = this.getParser().parse(image_filter);
        for (int i = 0; i < image_nodes.size(); i++) {
            ImageTag node = (ImageTag) image_nodes.elementAt(i);
            //获取当前节点的SRC属性值
                String image_url = node.getAttribute("src");
                //提取文件类型
                String fileType = image_url.substring(image_url
                        .lastIndexOf(".") + 1);
                //生成新的图片的文件名
                String new_iamge_file = StringUtils.encodePassword(
                        image_url, HASH_ALGORITHM)
                        + "." + fileType;
                image_url = StringUtils.replace(image_url, "+", " ");
                //利用mirror目录下的图片生成的新的图片
                copyImage(image_url, new_iamge_file);
                bw.write(image_url + NEWLINE);
                bw.write(SEPARATOR + NEWLINE);
                bw.write(new_iamge_file + NEWLINE);

                System.out.println(image_url);
        }
    } catch (Exception e) {
        e.printStackTrace();
    }
    try{
        if (bw != null)
            bw.close();
    }catch(IOException e){
        e.printStackTrace();
    }

}

}

运行结果：

文件名中为什么会有回车符。。。。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

13条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
果冻剑客 2016-11-17 09:40
关注
一般都使用字符串的替换来解决你这个问题，可能路径会出现一些特殊的字符，我们可以通过replace 替换掉指定字符。
或者你只保存名字，分割符使用 File.separator 这个会根据系统的不同生成相应的分隔符

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(12条)

报告相同问题？

关注问题

文件路径正确，报java.io.FileNotFoundException异常的原因及解决办法
2020-09-02 11:59

在Java开发过程中，使用文件I/O操作时遇到java.io.FileNotFoundException异常是一个比较常见的问题。即使文件路径正确无误，也可能会因为多种原因导致这个异常的发生。该异常属于编译时异常，即必须显式处理才能通过...
解决Hadoop环境错误：java.io.FileNotFoundException: java.io.FileNotFoundException: HADOOP_HOME and hadoop.ho
2025-06-12 13:50

GawynKing的博客 java.io.FileNotFoundException: HADOOP_HOME and hadoop.home.dir are unset"错误。该问题是由于缺少Windows原生支持文件所致。解决方法包括：1)从GitHub下载winutils工具包；2)设置HADOOP_HOME环境变量指向...
java.io.filenotfoundexception:_【JAVA小白】问关于java.io.FileNotFoundException: 的问题
2021-03-09 21:59

意博思诺意大利留学的博客代码如下：package file;import java.io.File;import java.io....import java.io.FileNotFoundException;import java.io.IOException;public class TestClose {public static void main(String\[\] args) {/...
java.io.FileNotFoundException异常的解决方案
2024-05-31 15:06

梅菊林的博客 java.io.FileNotFoundException 是 Java 中一个常见的异常，通常出现在尝试访问一个不存在的文件时。这个异常是 java.io 包中的一部分，并且继承自 IOException。当程序试图执行文件 I/O 操作，如打开文件、读取文件...
【开发问题记录】java.io.IOError: java.io.FileNotFoundException: Invalid file path 的问题定位
2023-02-27 18:03

lcn29的博客 oClassDefFoundError 异常可以简单的理解为 Java 编译期能够找得到对应的 Class, 而到了运行时, 找不到合适的 Class。这个文件有异常, 从网上下载了一个正常的, 进行替换后, 还是同样的问题, 也就是。
java.io.FileNotFoundException与java.io.IOException
2022-04-12 09:32

GetNewPerson的博客 FileNotFoundException 开发背景：系统需添加一个我的云盘模块，有文件上传功能，同步上传发现大文件上传很慢，用户等待...java.io.FileNotFoundException: C:\Users\***\work\Catalina\localhost\ROOT\upload_22e25
nested exception is java.io.FileNotFoundException
2023-09-07 19:49

给我一个源代码的博客 nested exception is java.io.FileNotFoundException: class path resource [com/heima/apis/article/IArticleClient.class] cannot be opened because it does not exist. 找不到配置类错误，这个我是在初学微服务...
java.io.file 报错_关于java.io.FileNotFoundException异常问题？
2021-02-28 17:38

weixin_42512509的博客本帖最后由郝强勇于 2013-3-14 16:18 编辑下面的代码是客户端在访问servlet时，在servlet中调用数据库操作层UserDao对象中的update方法...但是在访问servlet时，会抛出java.io.FileNotFoundException: C:\Program...
caused by java.io.io_Caused by: java.io.FileNotFoundException: class path resource
2021-03-10 02:31

weixin_39732991的博客 java.lang.IllegalStateException: Failed to load ApplicationContextat org.springframework.test.context.cache.DefaultCacheAwareContextLoaderDelegate.loadContext(DefaultCacheAwareContextLoaderDelegate.ja...
java.io.filenotfoundexception:_Java IO FileNotFoundException:常用解决办法
2021-03-09 22:00

羊迪的博客一般来说是因为父路径缺乏,或者文件没创建。举一个例子Android中1,父路径缺乏String path=Environment.getExternalStorageDirectory().getPath()+"/XianDian/";XianDian目录是不存在的,所以加个判断File parent =new...
excel导入 java.io.FileNotFoundException
2022-06-13 11:04

zzh3864的博客报错信息：java.io.FileNotFoundException: /private/var/folders/r6/tnx0k4qx323g3mbx6ytnjmqw0000gn/T/tomcat.2979450461592828331.5678/work/Tomcat/localhost/management-promgr-service#api/upload_c3b21a59_...
java.io.FileNotFoundException: java.io.FileNotFoundException: HADOOP_HOME and hadoop.home.dir are un
2022-06-13 17:34

条件漫步的博客尝试用本地pySpark读取远程的hive数据时候出现的问题。本地需要安装配置hadoop的环境变量，把hadoop.dll放到system32中。
java.io.FileNotFoundException: applicationContext.xml
2022-05-19 16:30

我叫嘻嘻呵呵的博客 nested exception is java.io.FileNotFoundException: applicationContext.xml 原因其实很简单，applicationContext.xml不在根目录下。但是我明明记得以前这么写是不会报错的，为什么这回就找不到...
java.io.FileNotFoundException异常的完美解决方法，亲测有效，嘿嘿嘿
2024-05-02 11:26

代码无疆的博客 `java.io.FileNotFoundException` 是 Java 在尝试访问一个文件时，如果该文件不存在于指定的路径下，或者由于某种原因（如权限问题、路径错误等）无法被访问时，就会抛出的一个异常。 ### 问题分析当我们在 Java ...
MultipartFile上传文件异步处理时的java.io.FileNotFoundException
2024-01-20 08:05

NaughtyBo的博客文章目录问题描述处理方式问题描述在接收到前端的文件上传请求时，在对应的controller方法中使用线程池异步处理文件相关的逻辑时，会偶尔发生java.io.FileNotFoundException异常。 java.io....
java.io.FileNotFoundException
2021-07-12 10:24

LEO_CAT的博客 java.io.FileNotFoundException 1.引起这种错误是多方面的，我的是因为文件夹是中文。用的是org.springframework.util.ResourceUtils获取路径 String pathstr = ResourceUtils.getURL("classpath:").getPath(); ...
FileInputStream中的java.io.FileNotFoundException异常
2022-08-16 19:07

冲浪二代目的博客 FileInputStream中莫名出现java.io.FileNotFoundException异常
java.io.FileNotFoundException open failed: EACCES (Permission denied)
2024-08-29 20:09

南柯一梦梦红尘的博客针对java.io.FileNotFoundException open failed: EACCES (Permission denied)出现的问题，是由于当前使用的安卓版本过高导致的，出现了文件访问失败。1\解决方法是在AndroidMainfest中添加android:...
【Java报错已解决】 Java.io.FileNotFoundException
2024-10-20 00:10

鸽芷咕的博客在 Java 开发的过程中，报错信息常常让...其中，Java.io.FileNotFoundException 是一个较为常见的报错。当遇到这个报错时，如何快速有效地解决呢？本文将深入探讨这个问题，为开发者和环境配置者提供详细的解决方案。
没有解决我的问题, 去提问

java.io.FileNotFoundException问题

13条回答 默认 最新

13条回答默认最新