spark读取本地文件报错

在scala编写spark程序使用了sc.textFile("file:///home/hadoop/2.txt"),

竟然报错java.io.FileNotFoundException: File file:/home/hadoop/2.txt does not exist，之后又用spark-shell测试，依旧报这样错误

 scala> val rdd = sc.textFile("file:///home/hadoop/2.txt")
rdd: org.apache.spark.rdd.RDD[String] = file:///home/hadoop/2.txt MapPartitionsRDD[5] at textFile at <console>:24
scala> rdd.take(1)
17/08/29 20:27:28 WARN scheduler.TaskSetManager: Lost task 0.0 in stage 1.0 (TID 4, slaves3, executor 2): java.io.FileNotFoundException: File file:/home/hadoop/2.txt does not exist

我cat文件是有输出的

 [hadoop@master ~]$  cat /home/hadoop/2.txt
chen    001     {"phone":"187***","sex":"m","card":"123"}
zhou    002     {"phone":"187***","sex":"f","educetion":"1"}
qian    003     {"phone":"187***","sex":"f","book":"2"}
li      004     {"phone":"187***","sex":"f"}
wu      005     {"phone":"187***","sex":"f"}
zhang   006     {"phone":"187***","sex":"f"}
xia     007     {"phone":"187***","sex":"f"}
wang    008     {"phone":"187***","sex":"f"}
lv      009     {"phone":"187***","sex":"m"}

之后我将文件放在hdfs上面，就能读取的到，这是怎么回事

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2017-08-30 15:54
关注
http://blog.csdn.net/zy_zhengyang/article/details/46853441

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【Spark】读取本地文件
2024-04-29 11:12

five小点心的博客 spark任务读取本地csv文件。
Spark读取json文件报错Job aborted due to stage failure
2024-01-15 14:00

星星星星辰祈愿的博客【代码】Spark读取json文件报错Job aborted due to stage failure。
spark-shell 加载本地文件报错 java.io.FileNotFoundException
2021-05-21 10:50

hzp666的博客学习spark-shell 时候发现一个问题，从本地文件加载数据生成RDD 报错，文件找不到原因：spark-shell 如果启动了集群模式，真正负责计算的executor会在，该executor所在的 worker节点上读取文件，并不是在master...
Spark读取本地文件和HDFS文件
2020-01-09 11:44

SunnyRivers的博客旁边的实习生又一脸懵逼了：Spark有bug，明明我本地/data目录下有test.txt文件，但运行就报错: Caused by: java.io.FileNotFoundException: File file:/data/test.txt does not exist 我一看，原来小伙子使用spark...
解决Spark读取tmp结尾的文件报错的问题
2023-04-14 18:07

硅谷工具人的博客 flume采集文件到hdfs中，在采集中的文件会添加.tmp后缀。一个批次完成提交后，会将.tmp后缀重名名，将tmp去掉。所以，当Spark程序读取到该hive外部表映射的路径时，在出现找不到xxx.tmp文件的问题出现。
spark读取jar中txt文件报错文件找不到
2023-03-27 17:31

DSJ_ kohler的博客因此，如果您需要在 Spark 任务中读取 jar 包内的文件，建议使用 getClass.getClassLoader.getResourceAsStream(filename) 方法。需要注意的是，绝对路径在不同的机器上可能不同，因此这种方法并不可移植。建议仅在...
为什么Spark在运行代码的时候拉取本地文件报错hdfs上不存在
2021-02-28 22:30

尘世壹俗人的博客你看一下你的运行环境是不是配置HADOOP_HOME，或者配置文件中配置了yarn关联，如果有那么你要在你的路径前面叫上file:/// 不然Spark会把路径自动变成hdfs的路径的
09.大数据技术之Spark
2022-07-13 14:07

数据带你飞的博客目前，Spark生态系统已经发展成为一个包含多个子项目的集合，其中包含SparkCore、SparkSQL、Spark Streaming、GraphX、MLib、SparkR等子项目，Spark是基于内存计算的大数据并行计算框架。除了扩展了广泛使用的 ...
Spark RDD编程文件数据读写
2023-03-13 10:05

程序员喵姐的博客 Spark RDD编程文件数据读写
大数据实验实验六：Spark初级编程实践
2023-11-28 10:34

ADBOEX的博客 大数据实验实验六：Spark初级编程实践
没有解决我的问题, 去提问

spark读取本地文件报错

1条回答 默认 最新

1条回答默认最新