java处理读取一个文件夹下的10个文件后再读取11~20该如何实现呢？

import java.io.IOException;
import java.net.URI;
import java.util.Date;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.FileUtil;
import org.apache.hadoop.fs.Path;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.Function;

import scala.Tuple3;

public class Test {

public static void main(String[] args) throws IOException {
    // 创建一个配置类SparkConf，然后创建一个SparkContext
    SparkConf conf = new SparkConf().setAppName("CollectFemaleInfo");
    JavaSparkContext jsc = new JavaSparkContext(conf);
    String url = "E://";
    JavaRDD<String> data = null;
    Configuration config = new Configuration();
    FileSystem hoursHDFS = FileSystem.get(URI.create(url),config);
    FileStatus[] hoursFile = hoursHDFS.listStatus(new Path(url));
    Path[] paths = FileUtil.stat2Paths(hoursFile);
    for (int i = 0; i < paths.length; i++) {
        Path path = paths[i];
        // 读取原文件数据,每一行记录转成RDD里面的一个元素
        data = jsc.textFile(path.toString());
        String newFile = "E://"+Long.valueOf(new Date().getTime())+".txt";
        FileSystem newHDFS = FileSystem.get(URI.create(newFile),config);
        // 将每条记录的每列切割出来，生成一个Tuple
        JavaRDD<Tuple3<String, String, Integer>> person = data
                .map(new Function<String, Tuple3<String, String, Integer>>() {
                    private static final long serialVersionUID = -2381522520231963249L;

                    public Tuple3<String, String, Integer> call(String s)
                            throws Exception {
                        // 按逗号分割一行数据
                        String[] tokens = s.split(",");
                        // 将分割后的三个元素组成一个三元Tuple
                        Tuple3<String, String, Integer> person = new Tuple3<String, String, Integer>(
                                tokens[0], tokens[1], Integer
                                        .parseInt(tokens[2]));
                        return person;
                    }
                });
        FSDataOutputStream os = newHDFS.create(new Path(newFile),true);
        // 遍历数据写到新文件中
        for (Tuple3<String,String, Integer> d : person.collect()) {
            StringBuffer sb = new StringBuffer();
            sb.append(d._1() + "," + d._2()+","+d._3());
            os.write(sb.toString().getBytes("UTF-8"));
        }
    }
    // 将每条记录的每列切割出来，生成一个Tuple
    jsc.stop();
    jsc.close();
}

}
首先是代码。
目前功能已实现到读取文件夹的文件写到一个新文件上。
但是想以10个文件读取一次写到一个新文件上。没啥思路。
因为我写代码对于算法逻辑最是想不通。
求大神指教，另外代码是用spark处理的。在读文件时也是在hdfs里去读取。目前代码是写的本地路径

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

wlq199101 2017-05-22 03:31

关注

 int i = 1;
        int total = 102;
        List list = new ArrayList<>();
        while (i <= 102) {
            if (i % 10 == 0 || i == total) {
                // TODO:操作文件
                list.add(i);
                System.err.println(list.toString());
                list = new ArrayList<>();
            } 
            else {
                // TODO:读写
                list.add(i);
            }
            i++;
        }

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

java代码读取文件夹下所有文件内容，实现读取一个文件处理一个文件！？ java
2018-03-27 02:39

回答 4 已采纳先获取文件，然后对原文件进行读写就可以了 /** * One.txt中的数据如下: * 1 * 2 * 3 * 4 * 5 * --------------
用java读取一个文件夹下的文件，同名的图片和文本建立一个关系 java 数据库
2018-12-13 08:28

回答 2 已采纳一个map就搞定了，文件名做key,文件全名做value,value坐追加操作，不要覆盖了就行
java实现读取文件夹里面压缩包的名称并返回学号 java 有问必答
2022-04-11 21:29

回答 2 已采纳用File获取文件列表，循环获取文件名，学号长度的固定的，取前面11位。
Java实现读取文件夹下（包括子目录）所有文件的文件名
2020-09-03 14:20

以下是一个详细的Java实现，用于读取文件夹下（包括子目录）所有文件的文件名：首先，我们创建一个名为`FileList`的类，它包含以下几个成员变量： 1. `dir_name`: 用来存储文件夹的路径。 2. `list_name`: 用来...
如何用Java设计一个程序读取一个文件夹下所有文本文档第一行 java 有问必答
2021-09-19 20:03

回答 1 已采纳思路：1.使用File对象获取指定文件夹下面的所有txt文件；2.用BufferedReader对象打开文件，用readLine方法读取第一行。
遍历读取每个文件夹下的TXT文件 python 有问必答
2022-03-18 19:49

回答 2 已采纳 file 只是文件名,要用 os.path.join(path, file) 在文件名前拼接上文件夹路径你题目的解答代码如下： path = '文件夹路径' files = [] for file
怎么用java的ftp来获取某个文件夹下的部分文件？ java
2018-10-17 10:41

回答 1 已采纳 ``` Iterator it = ftp.listFiles("/目录"); int i = 0; while (it.hasNext() && ++i < 10) { Ft
java实现读取、删除文件夹下的文件
2020-09-03 16:55

本文将深入探讨如何使用Java来实现这两个功能，特别是针对文件夹及其包含的文件。首先，我们需要了解`java.io.File`类，它是处理文件和目录的核心类。 1. **读取文件夹中的文件** 在Java中，我们可以使用`File`类的...
在文件数量过多的情况下java怎么获取文件夹下第一个文件并且不使用List遍历 java
2015-09-11 03:00

回答 2 已采纳你看到的文件夹下面的第一个文件是操作系统的，如果用Java的API取出来，顺序是乱的，而且文件数量过多能多多少呢？上百个、？你可以只遍历文件名，或者在取文件的时候对文件进行一个排序，然后在取对应的
java读取zip压缩文件里面二级文件夹目录内的文件的问题 java
2016-02-23 08:45

回答 2 已采纳 ``` public static void main(String[] args) { try { Enumeration urls = X509Util.class.getCla
java file怎么读取空文件夹 intellij-idea java
2020-06-29 18:46

回答 1 已采纳你没有给出代码只能大概说说了 File[] files = file.listFiles(); if (!file.isFile() && files == null) //说明file是一个空
java读取某个文件夹下的所有文件实例代码
2020-08-31 02:53

在Java编程中，读取文件夹下的所有文件是一项常见的任务，特别是在处理数据、文件管理或自动化脚本等场景中。以下是一个具体的实例代码，展示了如何使用Java API来实现这个功能： ```java import java.io.File; ...
Java读取其下所有文件夹与文件路径的方法
2020-08-27 20:22

Java读取其下所有文件夹与文件路径的方法是Java编程中一个常见的问题，解决这个问题可以使用Java的File类和ArrayList来实现。下面是Java读取其下所有文件夹与文件路径的方法的详细介绍：首先，需要引入必要的包，...
java递归实现复制一个文件夹下所有文件功能
2020-08-25 18:01

1. Java的IO操作：Java的IO操作主要包括文件的读取和写入，Java提供了多种IO流来实现文件的读取和写入，例如FileInputStream和FileOutputStream。 2. 文件和文件夹的操作：Java提供了File类来操作文件和文件夹，...
Java利用文件输入输出流实现文件夹内所有文件拷贝到另一个文件夹
2020-08-27 20:35

Java语言提供了多种方式来实现文件夹内所有文件拷贝到另一个文件夹，本文将介绍使用文件输入输出流实现文件夹内所有文件拷贝到另一个文件夹的方法。一、基本目标使用Java完成以下操作：把一个文件夹内的所有文件...
没有解决我的问题, 去提问

悬赏问题

¥30 Matlab打开默认名称带有/的光谱数据
¥50 easyExcel模板动态单元格合并列
¥15 res.rows如何取值使用
¥15 在odoo17开发环境中，怎么实现库存管理系统，或独立模块设计与AGV小车对接？开发方面应如何设计和开发？请详细解释MES或WMS在与AGV小车对接时需完成的设计和开发
¥15 CSP算法实现EEG特征提取，哪一步错了？
¥15 游戏盾如何溯源服务器真实ip?需要30个字。后面的字是凑数的
¥15 vue3前端取消收藏的不会引用collectId
¥15 delphi7 HMAC_SHA256方式加密
¥15 关于#qt#的问题：我想实现qcustomplot完成坐标轴
¥15 下列c语言代码为何输出了多余的空格

码龄粉丝数原力等级 --

java处理读取一个文件夹下的10个文件后再读取11~20该如何实现呢？

3条回答默认最新

码龄粉丝数原力等级 --

悬赏问题

java处理读取一个文件夹下的10个文件后再读取11~20该如何实现呢？

3条回答 默认 最新

悬赏问题

3条回答默认最新