Spark textFile 不读取文件第一行

图片说明
这样读文件后，第一行存在，如果不读取第一行，该如何写？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
u54782509 2017-05-07 10:57
关注
跳过第一行:
lines = sc.textFile('path_to_data')
header = lines.first()
lines = lines.filter(row => row != header)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 6

无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

SparkRDD数据数据读取：readTextFile和HadoopRDD
2024-08-02 01:21

光子AI的博客《SparkRDD数据读取：readTextFile和HadoopRDD》 1. 背景介绍 1.1 问题的由来在大数据时代，数据的规模和复杂性都在不断增长。传统的数据处理方式已经无法满足现代应用的需求
大数据编程实验一：HDFS常用操作和Spark读取文件系统数据
2022-10-30 16:26

-北天-的博客 大数据编程实验，利用本地搭建的伪分布式集群进行HDFS常用操作和Spark读取文件系统数据的操作。
Spark core通过textFile读取Hdfs文件blockSize如何设置？
2023-02-13 15:41

datachuizi的博客其实Spark core无论是读取hdfs还是读取本地文件都会以hadoopfile的形式进行读取，不同点在于读取本地文件时可以通过在resources文件中放入hdfs-site.xml文件设置fs.local.block.size参数来控制blocksize大小，而读取...
spark通过textFile读取hdfs数据分区数量规则
2020-07-02 15:04

xuexue1_1的博客作者：越走越远的风 ...来源：简书著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。话不多说，直接上代码 ...val conf = new SparkConf().setAppName(...val rdd = sc.textFile("E:\\fandf\.
大数据技术原理及应用课实验7 :Spark初级编程实践
2024-01-16 20:03

在Spark Shell中，可以通过`textFile()`函数读取文件，例如读取本地文件"/home/hadoop/test.txt"，只需一行命令`sc.textFile("/home/hadoop/test.txt")`。若要读取HDFS上的文件，需要指定HDFS的URL，如`sc.textFile...
Spark 用textFile处理带表头csv的大数据
2020-06-06 18:09

Mid-Sep的博客巧用read.format.option其他说明解决其他说明目的是为了用spark做可视化分析 ...textFile.filter(line => line !=header) 不知为何，我的python好像拒绝给我识别 > 解决先用 df=spark.read.format("csv").op
【spark数据处理】文件上传+文件读取+文件筛选
2024-04-16 00:00

sc.溯琛的博客对多列进行分组，并对每组进行聚合计数,这段代码首先创建了一个SparkSession实例，然后创建了一个包含三列（"columnName1", "columnName2", "col"）的DataFrame。hadoop fs -put /data/wenjian1.csv /data //上传...
scala读取本地hdfs_Spark从外部读取数据之textFile
2020-12-30 21:56

句子院的博客 TextFile函数详解/***ReadatextfilefromHDFS,alocalfilesystem(availableonallnodes),orany*Hadoop-supportedfilesystemURI,andreturnitasanRDDofStrings.*/deftextFile(...
Spark中textFile源码分析
2020-09-03 14:03

CodeShelby的博客 textfile从文件系统中读取文件，基于读取的数据，创建HadoopRDD！ object Spark02_RDD_File { def main(args: Array[String]): Unit = { val sparkConf = new SparkConf().setMaster("local").setAppName("File...
spark读取json文件
2021-12-21 14:31

月亮给我抄代码的博客 tips:在spark2.0版本之后，SparkConf、SparkContext和SQLContext都已经被封装在SparkSession当中。测试文本内容 {"name":"jack","age":20} {"name":"zhangsan","age":19} {"name":"lisi","age":25} {"name":...
没有解决我的问题, 去提问

Spark textFile 不读取文件第一行

3条回答 默认 最新

3条回答默认最新