weixin_44595896 2019-03-04 15:42 采纳率: 40%
浏览 1387

Python遍历文件夹的文件提取关键信息到新的表格

各位大神好,小弟目前在自学Python处理办公的一些数据,遇到一个问题:
假设目前有一份excel数据,格式为
df = ['ID', 'Name', 'Tracking Number'], 大概几千行这样;
另一个文件夹A下面有名称格式包含生成日期的多个CSV数据文件,格式为
df1 = ['Num1', 'Num2', 'Num3', 'Tracking Number'];
现在想根据df这里面的Tracking Number这一列的数据,去遍历文件夹A下面的所有CSV文件找到对应的Num1,Num2, Num3并且提取到df里面对应的行。

我目前尝试的方法是将A文件夹下所有文件合并成一个df,去重后再根据TrackingNumber使用merge函数拼接过去,这样的话随着A文件夹文件数量增多生成的合并df会很大,运行很慢,步骤过于繁琐,想请教一下各位有没有快捷点的方法可以实现?

  • 写回答

1条回答

  • 手打天下_001 2019-03-04 18:21
    关注

    不需要对A文件夹进行任何改动,
    1.可以遍历A文夹件中的文件(参考os.walk()),将遍历结果存为一个字典或是列表
    2.字典或是列表内容,打开对应的文件
    3.根据关键字得对得应的结果
    4.输出,并关闭文件

    评论

报告相同问题?

悬赏问题

  • ¥15 超声波模块测距控制点灯,灯的闪烁很不稳定,经过调试发现测的距离偏大
  • ¥15 import arcpy出现importing _arcgisscripting 找不到相关程序
  • ¥15 onvif+openssl,vs2022编译openssl64
  • ¥15 iOS 自定义输入法-第三方输入法
  • ¥15 很想要一个很好的答案或提示
  • ¥15 扫描项目中发现AndroidOS.Agent、Android/SmsThief.LI!tr
  • ¥15 怀疑手机被监控,请问怎么解决和防止
  • ¥15 Qt下使用tcp获取数据的详细操作
  • ¥15 idea右下角设置编码是灰色的
  • ¥15 全志H618ROM新增分区