java处理读取一个文件夹下的10个文件后再读取11~20该如何实现呢？

import java.io.IOException;
import java.net.URI;
import java.util.Date;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.FileUtil;
import org.apache.hadoop.fs.Path;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.Function;

import scala.Tuple3;

public class Test {

public static void main(String[] args) throws IOException {
    // 创建一个配置类SparkConf，然后创建一个SparkContext
    SparkConf conf = new SparkConf().setAppName("CollectFemaleInfo");
    JavaSparkContext jsc = new JavaSparkContext(conf);
    String url = "E://";
    JavaRDD<String> data = null;
    Configuration config = new Configuration();
    FileSystem hoursHDFS = FileSystem.get(URI.create(url),config);
    FileStatus[] hoursFile = hoursHDFS.listStatus(new Path(url));
    Path[] paths = FileUtil.stat2Paths(hoursFile);
    for (int i = 0; i < paths.length; i++) {
        Path path = paths[i];
        // 读取原文件数据,每一行记录转成RDD里面的一个元素
        data = jsc.textFile(path.toString());
        String newFile = "E://"+Long.valueOf(new Date().getTime())+".txt";
        FileSystem newHDFS = FileSystem.get(URI.create(newFile),config);
        // 将每条记录的每列切割出来，生成一个Tuple
        JavaRDD<Tuple3<String, String, Integer>> person = data
                .map(new Function<String, Tuple3<String, String, Integer>>() {
                    private static final long serialVersionUID = -2381522520231963249L;

                    public Tuple3<String, String, Integer> call(String s)
                            throws Exception {
                        // 按逗号分割一行数据
                        String[] tokens = s.split(",");
                        // 将分割后的三个元素组成一个三元Tuple
                        Tuple3<String, String, Integer> person = new Tuple3<String, String, Integer>(
                                tokens[0], tokens[1], Integer
                                        .parseInt(tokens[2]));
                        return person;
                    }
                });
        FSDataOutputStream os = newHDFS.create(new Path(newFile),true);
        // 遍历数据写到新文件中
        for (Tuple3<String,String, Integer> d : person.collect()) {
            StringBuffer sb = new StringBuffer();
            sb.append(d._1() + "," + d._2()+","+d._3());
            os.write(sb.toString().getBytes("UTF-8"));
        }
    }
    // 将每条记录的每列切割出来，生成一个Tuple
    jsc.stop();
    jsc.close();
}

}
首先是代码。
目前功能已实现到读取文件夹的文件写到一个新文件上。
但是想以10个文件读取一次写到一个新文件上。没啥思路。
因为我写代码对于算法逻辑最是想不通。
求大神指教，另外代码是用spark处理的。在读文件时也是在hdfs里去读取。目前代码是写的本地路径

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答

wlq199101 2017-05-22 03:31

关注

 int i = 1;
        int total = 102;
        List list = new ArrayList<>();
        while (i <= 102) {
            if (i % 10 == 0 || i == total) {
                // TODO:操作文件
                list.add(i);
                System.err.println(list.toString());
                list = new ArrayList<>();
            } 
            else {
                // TODO:读写
                list.add(i);
            }
            i++;
        }

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

java处理读取一个文件夹下的10个文件后再读取11~20该如何实现呢？ java
2017-05-22 03:11

回答 3 已采纳 ``` int i = 1; int total = 102; List list = new ArrayList<>(); while (i ();
java代码读取文件夹下所有文件内容，实现读取一个文件处理一个文件！？ java
2018-03-27 02:39

回答 4 已采纳先获取文件，然后对原文件进行读写就可以了 /** * One.txt中的数据如下: * 1 * 2 * 3 * 4 * 5 * --------------
用java读取一个文件夹下的文件，同名的图片和文本建立一个关系 java 数据库
2018-12-13 08:28

回答 2 已采纳一个map就搞定了，文件名做key,文件全名做value,value坐追加操作，不要覆盖了就行
Java实现读取文件夹下（包括子目录）所有文件的文件名
2020-09-03 14:20

主要介绍了Java实现读取文件夹下（包括子目录）所有文件的文件名,本文把代码组织成了一个模块,可以很方便的使用,需要的朋友可以参考下
java实现读取文件夹里面压缩包的名称并返回学号 java 有问必答
2022-04-11 21:29

回答 2 已采纳用File获取文件列表，循环获取文件名，学号长度的固定的，取前面11位。
如何用Java设计一个程序读取一个文件夹下所有文本文档第一行 java 有问必答
2021-09-19 20:03

回答 1 已采纳思路：1.使用File对象获取指定文件夹下面的所有txt文件；2.用BufferedReader对象打开文件，用readLine方法读取第一行。
遍历读取每个文件夹下的TXT文件 python 有问必答
2022-03-18 19:49

回答 2 已采纳 file 只是文件名,要用 os.path.join(path, file) 在文件名前拼接上文件夹路径你题目的解答代码如下： path = '文件夹路径' files = [] for file
java中读取目录下指定的文件
2022-12-10 23:15

java中读取目录下指定的文件
怎么用java的ftp来获取某个文件夹下的部分文件？ java
2018-10-17 10:41

回答 1 已采纳 ``` Iterator it = ftp.listFiles("/目录"); int i = 0; while (it.hasNext() && ++i < 10) { Ft
在文件数量过多的情况下java怎么获取文件夹下第一个文件并且不使用List遍历 java
2015-09-11 03:00

回答 2 已采纳你看到的文件夹下面的第一个文件是操作系统的，如果用Java的API取出来，顺序是乱的，而且文件数量过多能多多少呢？上百个、？你可以只遍历文件名，或者在取文件的时候对文件进行一个排序，然后在取对应的
java读取zip压缩文件里面二级文件夹目录内的文件的问题 java
2016-02-23 08:45

回答 2 已采纳 ``` public static void main(String[] args) { try { Enumeration urls = X509Util.class.getCla
java实现读取、删除文件夹下的文件
2020-09-03 16:55

本文给大家分享的是java实现读取、删除文件夹下的文件，其中File.delete()用于删除“某个文件或者空目录”！所以要删除某个目录及其中的所有文件和子目录，要进行递归删除，有需要的小伙伴可以参考下。
java file怎么读取空文件夹 intellij-idea java
2020-06-29 18:46

回答 1 已采纳你没有给出代码只能大概说说了 File[] files = file.listFiles(); if (!file.isFile() && files == null) //说明file是一个空
java读取某个文件夹下的所有文件实例代码
2020-08-31 02:53

主要介绍了java读取某个文件夹下的所有文件实例代码的相关资料,需要的朋友可以参考下
Java读取其下所有文件夹与文件路径的方法
2020-08-27 20:22

主要为大家详细介绍了Java读取其下所有文件夹与文件路径的方法，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
没有解决我的问题, 去提问

悬赏问题

¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
¥20 腾讯企业邮箱邮件可以恢复么
¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗？
¥15 错误 LNK2001 无法解析的外部符号
¥50 安装pyaudiokits失败
¥15 计组这些题应该咋做呀
¥60 更换迈创SOL6M4AE卡的时候，驱动要重新装才能使用，怎么解决？
¥15 让node服务器有自动加载文件的功能
¥15 jmeter脚本回放有的是对的有的是错的
¥15 r语言蛋白组学相关问题

码龄粉丝数原力等级 --

java处理读取一个文件夹下的10个文件后再读取11~20该如何实现呢？

3条回答

码龄粉丝数原力等级 --

悬赏问题