python 做CSV 批量数据分析处理

Python 0基础，工作原因需要进行大量数据处理，问题如下：

有以下路径：desktop/CM_report_C00/ 下多个sub folders, 每个sub- folder 有若干csv 文件，每个csv 文件内容如下图所示：

需要实现3个目标：

遍历所有子文件夹，统计csv 文件名中前14位出现的频次，例如 LE2B029-080104 出现1次，生成report.csv文件记录，此处并非遍历csv 内部内容的serial Number 出现的次数，只是看csv 文件名的前14位，确认是否有的产品测试了两次。
遍历所有csv 文件，将每个csv 的第三行前两列写入第二行前两列，无需生成新文件，在原文件做覆盖修改即可。
将第二步修改后的所有子文件夹的csv 文件merge 成一个allinone.csv，因原文件headname 最后一列缺失，增加最后一列的headname 为“path”

略附悬赏，望帮助

需注意的是，原文件的所有csv 文件，均如下图所示，最后一列没有head name，我之前尝试使用pandas 的时候会报错

引用ShowmeAI 的答案，报错如下：

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

7条回答默认最新

一切因为有你 2022-12-27 12:54

关注

##路径改成你的应该可以直接跑，试一下


import pandas as pd
import os

path='desktop/CM_report_C00/'

dirs=os.listdir(path) ##子文件夹

fct={}
allinone=pd.DataFrame()
for dir1 in dirs:
    path1=path+dir1+'/'
    fs=os.listdir(path1)
    for f in fs:
        fct[f[0:14]]=fct.get(f[0:14],0)+1  ##前14位的次数
        df1=pd.read_csv(path1+f)
        df1.iloc[0,0:2]=df1.iloc[1,0:2] ##第二行1,2列替换成第三行1,2列的值
        df1.to_csv(path1+f,index=0) ##修改原始文件
        allinone=pd.concat([allinone,df1]) ##合并修改后的结果

report=pd.DataFrame({'nm':fct.keys(),'ct':fct.values()})
report.to_csv('desktop/report.csv',index=0)
cols=list(df1.columns)
cols[-1]='path'  ##最后一个head 
allinone.columns=cols
allinone.to_csv('desktop/allinone.csv',index=0)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(6条)

报告相同问题？

关注问题

python 做CSV 批量数据分析处理 python 数据分析数据结构
2022-12-27 09:04

回答 7 已采纳 ##路径改成你的应该可以直接跑，试一下 import pandas as pd import os path='desktop/CM_report_C00/' dirs=os.listdir(
使用python 实现对CSV文件数据的处理 python 大数据
2022-03-18 16:05

回答 2 已采纳 import pandas as pd import re df = pd.DataFrame({'Category':['C,D','A,B,C','A,D','C','A,D','A,B,C','
python读取csv数据后的时间数据处理？ python
2021-07-10 18:10

回答 2 已采纳这个是完整的读csv的例子： test.csv文件： a,2021/7/10,b,c py文件： import datetime import pandas as pd df = pd.read_
用Python实现股票数据分析
2023-07-14 10:17

-走走-停停-的博客用 Python 语言实现股票数据分析 实现功能如下： 1.文件可以从某个网址上下载 2.根据网址，编写程序自动下载中证白酒指数中 17 支股票的数据（即下载 17 个 csv 文件） 3.读取所下载的 17 个 csv 文件中有关股票的...
Python 做批量处理的问题 python 数据结构
2022-12-18 10:20

回答 4 已采纳试一下下面的代码实现，里面的路径部分你可以根据实际情况配置一下，有问题可以随时反馈，望采纳 import os # 设置要遍历的根文件夹路径 root_path = '/path/to/root/f
使用python中pandas进行数据分析 python 数据分析
2023-02-03 14:39

回答 2 已采纳 “该回答引用ChatGPT”可参考下面的方法，还请测试代码的可行性，如果可行还请点击采纳，感谢支持！ import pandas as pd # 读取 csv 文件 df = pd.read_cs
如何使用python导入csv文件，并将csv中某一列的数据生成一个列表？ python 数据分析数据挖掘
2022-01-03 11:59

回答 1 已采纳是否需要对原数据进行修改呢？如果不需要，请看以下方法：将读取出来的列，再进行赋值，就可以单独形成一个列表了。如果答案，您满意，请采纳意见和点赞关注，支持一下，谢谢！
Python+大数据-数据处理与分析(三)-数据清洗
2022-10-17 08:45

呆猛的呆呆小哥的博客 Python+大数据-数据处理与分析(三)-数据清洗
python 对csv 文件进行批处理 python 数据分析数据结构
2023-04-10 16:03

回答 8 已采纳占坑答题，先答复你的第一个小目标，每天搞一个小目标，按照统一的时间的格式来对文件名进行操作，假设source文件夹下有几个csv的文件，以下是代码片段： import os folder_path
一个python读取csv文件对指定列求和问题 python 开发语言
2022-02-14 15:21

回答 5 已采纳 import pandas as pd df=pd.read_csv('d:/data/newly_confirmed_cases_daily.csv') num=df.Akita.sum() pr
python 如何根据csv表格筛选数据？ python
2022-04-03 03:07

回答 5 已采纳 res = [] with open("aa.csv",'rt') as r: for line in r: line=line.strip()
用Python采集电商平台商品数据进行可视化分析
2023-07-17 16:35

魔王不会哭的博客环境使用: python 3.8 解释器 pycharm 编辑器模块使用: 第三方模块需要安装 requests —> 发送 HTTP请求内置模块不需要安装 csv —> 数据处理中经常会用到的一种文件格式第三方模块安装: win + R 输入cmd 输入...
python pandas 数据分析
2022-11-22 10:49

三成讲技术的博客 python pandas 数据分析
GEE-Python 遥感大数据处理
2022-06-17 09:58

WangYan2022的博客基于最热门的Python编程语言，从GEE-Python平台搭建、影像数据分析、本地和云端数据管理，以及云端数据论文出版级可视化等方面结合案例进行讲解和进阶训练，掌握实际操作能力。
Python小白（python数据分析与可视化）从入门到精通
2023-12-27 00:03

没有很懒吧的博客 Python小白（python数据分析与可视化）从入门到精通一、Python数据分析环境配置二、python数据收集和准备三、Python数据分析基础四、Python可视化基础五、进阶可视化技巧六、数据可视化实战
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金15元 12月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 12月27日
展开全部

悬赏问题

¥20 关于#stm32#的问题：需要指导自动酸碱滴定仪的原理图程序代码及仿真
¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
¥15 stata安慰剂检验作图但是真实值不出现在图上
¥15 c程序不知道为什么得不到结果
¥40 复杂的限制性的商函数处理
¥15 程序不包含适用于入口点的静态Main方法
¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因

python 做CSV 批量数据分析处理

7条回答 默认 最新

问题事件

悬赏问题

7条回答默认最新