每一行的空格数是不同的,怎么把他每一列分开存到dataframe中呢?或者将这种txt文件转化成逗号分隔的csv也行?有大佬有解决方法吗
2条回答 默认 最新
- 关注
码龄 粉丝数 原力等级 --
- 被采纳
- 被点赞
- 采纳率
CSDN专家-HGJ 2021-06-23 15:22最佳回答 专家已采纳你可以这样写:df=pd.read_csv('xxx.txt',sep='\s\s+',engine='python')来读取间隔空格数不确定的数据。
如有帮助,请采纳。点击我回答右上角【采纳】按钮。
采纳该答案 已采纳该答案 专家已采纳评论解决 1 无用打赏举报微信扫一扫
分享评论登录 后可回复...
查看更多回答(1条)
报告相同问题?
提交
相关推荐 更多相似问题
- 2021-06-23 15:11回答 2 已采纳 你可以这样写:df=pd.read_csv('xxx.txt',sep='\s\s+',engine='python')来读取间隔空格数不确定的数据。 如有帮助,请采纳。点击我回答右上角【采纳】按钮
- 2021-07-12 10:15回答 1 已采纳 这个方法没有这个参数吧,或者charset?
- 2021-10-29 22:40回答 1 已采纳 pd.read_csv 方法中设置文件编码参数 encoding="utf-8"或encoding="gbk" data = pd.read_csv( r'F:\2021python学习\视频课件\
- 2020-12-04 03:18weixin_39558804的博客 python Pandas 读取txt表格的实例运行环境Python 2.7操作实例1.原始文本格式:空格分隔的txt,例如2016-03-22 00:06:24.4463094 中文测试字符2016-03-22 00:06:32.4565680 需要编辑encoding2016-03-22 00:06:32....
- 2020-12-25 09:39官例:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.round.html >>> df = pd.DataFrame(np.random.random([3, 3]), ... columns=['A', 'B', 'C'], index=['first', 'second', 'third']...
- 2018-09-26 00:46scxyz_的博客 今天一个不太懂编程的朋友让我帮他处理一些excel的表格,要求大概是:有20多个excel表,每个表里有42个sheet表格(sheet数量和名字相同)。最终需要根据对应的sheet名称将所有表格拼接成一个。 为了方式朋友数据...
- 2020-12-17 21:23回答 1 已采纳 把那个 \ 去掉试试
- 2022-04-24 10:52回答 1 已采纳 不是提示你了, 看下你的数据里面有没有'Module-A'这一列
- 2021-05-17 22:56回答 3 已采纳 一般读取比较规范的Excel,不会有问题,从报错信息看,可能是日期类型的字段有问题,不过需要拿到具体Excel文件才好分析原因。 测试了一下,删除表格上方的两行就可以了。
- 2021-01-20 04:29您可能感兴趣的文章:python 给DataFrame增加index行名和columns列名的实现方法用pandas中的DataFrame时选取行或列的方法python中pandas.DataFrame对行与列求和及添加新行与列示例pandas数据处理基础之筛选
- 2020-02-12 22:22梧桐雪的博客 这个过程大致分成两步,第一步是读取excel文件,使用pd.ExcelFile方法,可以存储在类似file的变量当中,第二步是把file中的内容用file.parse()方法解析至data中,转换成一个DataFrame数据帧。 具体代码如下: import...
- 2020-12-24 19:33(缺点:有缺失值就无法读取) 读: import numpy my_matrix = numpy.loadtxt(open("1.csv","rb"),delimiter=",",skiprows=0) 写: numpy.savetxt('2.csv', my_matrix, delimiter = ',') 可能遇到的问题: ...
- 2021-01-19 21:36回答 1 已采纳 在apply得函数里用try except 然后打印一下报错得行号就知道哪一行是float了
- 2019-04-05 19:54回答 2 已采纳 问题关键在于df1的column‘用户ID’有重复,这样使df2里一个用户ID对应df1多个相同的用户ID。这一点从df3里用户ID为1000015的多个行里有两个不同的用户账号创建时间可以得到验证。
- 2022-04-23 12:47回答 1 已采纳 两种方法二选一 # 方法一 df['year_month'] = df['date'].apply(lambda x: x.strftime('%Y-%m')) # 方法二 df['year_mon
- 2021-01-20 06:16Python的pandas包对表格化的数据处理能力很强,而SQL数据库的数据就是以表格的形式储存,因此经常将sql数据库里的数据直接读取为dataframe,分析操作以后再将dataframe存到sql数据库中。而pandas中的read_sql和to_...
- 2019-08-20 00:24是杰夫呀的博客 目录 为何使用 PySpark DataFrame Pandas DataFrame 数据结构特性 Spark DataFrame 数据结构与存储特性 ...Spark与Pandas中的DataFrame的区别 为何使用 PySpark DataFrame 使用 pandas 进行数据处理,dataframe...
- 2020-12-31 08:50后期小雨的博客 如何将数据从Pandas DataFrame写入HTML文件?今天番茄加速就来讲一下。读取HTML我们可以使用read_html()函数读取HTML文件...一个包含编程语言及其创建年份的表。另一个表中有土地面积及其成本(美元)。将以下HTML内容...
- 2021-06-29 12:10回答 3 已采纳 data.groupby('付款日期')['价税合计'].sum() 返回的是一个series类型的数据,新建赋值的时候需要再加个values data1['价税合计'] = data.groupb
- 2021-08-09 11:01dongfuguo的博客 10.2 UDP和TCP编程 10.3 Socket编程案例精选 10.4 网页内容读取与网页爬虫 第11章 安卓平台的Python编程/248 11.1 QPython简介 11.2 安卓应用开发案例 第12章 Windows系统编程/254 12.1 注册表编程 12.2 ...
- 没有解决我的问题, 去提问