pyspark 逐行读取本地csv文件。

本人新手，第一次接触spark。

希望大哥们可以提供下代码让我学习一下。非常感谢。

 import pyspark
sc = pyspark.SparkContext()
sql = SQLContext(sc)

df = (sql.read
         .format("com.databricks.spark.csv")
         .option("header", "true")
         .load("FireData-Part2.csv"))
df.show()

逐行读取df的数据。一秒读一条。希望会的大哥指导一下。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2018-05-18 15:51
关注
https://blog.csdn.net/qq_36603091/article/details/79626675

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python修改csv文件后读取csv文件失败 python
2022-04-24 16:46

回答 1 已采纳不要用utf-8 换成gbk
一个python读取csv文件对指定列求和问题 python 开发语言
2022-02-14 15:21

回答 5 已采纳 import pandas as pd df=pd.read_csv('d:/data/newly_confirmed_cases_daily.csv') num=df.Akita.sum() pr
Python CSV文件读写 python
2020-11-12 11:44

回答 2 已采纳 import csv filename = '1.csv'#文件名 list1 =[] with open(filename) as f: reader = csv.reader
python 读取csv文件转成字符串,在Python中将CSV文件的行读取为字符串
2021-02-20 00:01

CVRunner的博客 So I have a string of id's in numbers saved as CSVsAnd I want is to convert each rows on this csv file to be a string/list in pythonmylist=[411211, 1234404, 5711427, 13600442, 13600641, 13601660, 1361...
python读取csv文件 python
2022-04-26 15:45

回答 2 已采纳换成绝对路径，或者放到程序的启动目录，而且如果你是压缩着的，要解压
python逐行读取文件 python
2022-06-16 13:51

回答 1 已采纳 with open("data.txt","r") as f: a = f.readlines() for i in a: i = i.replace("\n",""
python 读取csv文件报错，如何解决？ python
2022-07-01 22:42

回答 2 已采纳少了个单引号KFC = pd.read_csv(r'/Users/31736/Desktop/Final Test for Data Analysis (KFC).csv')
Python读写CSV文件
2021-08-07 13:13

秦时明月之君临天下的博客逗号分隔值（Comma-Separated Values，CSV，有时也称为字符分隔值，因为分隔字符也可以不是逗号），其文件以纯文本形式存储表格数据（数字和文本）。纯文本意味着该文件是一个字符序列，不含必须像二进制数字那样被...
python读取csv文件修改 python 有问必答
2022-03-25 09:28

回答 4 已采纳 import pandas as pd csvobj=pd.read_csv('1.csv') Profitability=[] Cost=list(csvobj["Cost"]) Paid=list
【Python】 CSV 文件十二星座查询 python
2022-06-02 16:39

回答 1 已采纳 ls[ind][0]实际拿到的值是第一列的星座名称，是"水瓶座"，等等这样的字符串，这个是不能用int()转换成数值的。ls[ind][0]，你预期是要得到什么值？或者你试下这样ls[ind][3]，
Python读取csv文件后str转换为float python
2018-02-02 08:39

回答 4 已采纳 >>> a="-1" >>> float(a) -1.0 >>> a="-" >>> float(a) Traceba
python读取csv文件报错
2023-05-23 19:18

曾阿伦的博客 Traceback (most recent call last): File "D:\pywork\ZT_DataTeamMember\zhanglh\python\knowledge_base\esi_... File "D:\pywork\ZT_DataTeamMember\zhanglh\python\knowledge_base\esi_rank.py", line 69, in csv_2
Python的csv文件无法读取 python 有问必答
2021-08-12 13:13

回答 3 已采纳 open("2.csv")
PySpark大数据分析(3)：使用Python操作RDD
2020-09-04 11:21

唐犁的博客在Python中使用Spark，首先需要导入PySpark，然后创建一个SparkConf对象配置你的应用，再基于这个SparkConf创建一个SparkContext。以创建一个名为’MyApp’的本地应用为例： from pyspark import SparkConf, ...
Python入门之（6.3）CSV文件
2019-08-20 15:35

风筝_的博客 CSV（逗号分隔值）是一种用来存储表格数据（数字和文本）的纯文本文件，通常是用于存放电子表格或数据的一种文件格式。纯文本意味着该文件是一个字符序列，不包含必须像二进制数字那样被解读的数据。 CSV文件由任意...
没有解决我的问题, 去提问

悬赏问题

¥15 运筹学中在线排序的时间在线排序的在线LPT算法
¥30 求一段fortran代码用IVF编译运行的结果
¥15 深度学习根据CNN网络模型，搭建BP模型并训练MNIST数据集
¥15 lammps拉伸应力应变曲线分析
¥15 C++ 头文件/宏冲突问题解决
¥15 用comsol模拟大气湍流通过底部加热（温度不同）的腔体
¥50 安卓adb backup备份子用户应用数据失败
¥20 有人能用聚类分析帮我分析一下文本内容嘛
¥15 请问Lammps做复合材料拉伸模拟，应力应变曲线问题
¥30 python代码，帮调试，帮帮忙吧