weixin_44595896 2019-03-04 15:42 采纳率: 40%
浏览 1387

Python遍历文件夹的文件提取关键信息到新的表格

各位大神好,小弟目前在自学Python处理办公的一些数据,遇到一个问题:
假设目前有一份excel数据,格式为
df = ['ID', 'Name', 'Tracking Number'], 大概几千行这样;
另一个文件夹A下面有名称格式包含生成日期的多个CSV数据文件,格式为
df1 = ['Num1', 'Num2', 'Num3', 'Tracking Number'];
现在想根据df这里面的Tracking Number这一列的数据,去遍历文件夹A下面的所有CSV文件找到对应的Num1,Num2, Num3并且提取到df里面对应的行。

我目前尝试的方法是将A文件夹下所有文件合并成一个df,去重后再根据TrackingNumber使用merge函数拼接过去,这样的话随着A文件夹文件数量增多生成的合并df会很大,运行很慢,步骤过于繁琐,想请教一下各位有没有快捷点的方法可以实现?

  • 写回答

1条回答 默认 最新

  • 手打天下_001 2019-03-04 18:21
    关注

    不需要对A文件夹进行任何改动,
    1.可以遍历A文夹件中的文件(参考os.walk()),将遍历结果存为一个字典或是列表
    2.字典或是列表内容,打开对应的文件
    3.根据关键字得对得应的结果
    4.输出,并关闭文件

    评论

报告相同问题?

悬赏问题

  • ¥15 一道python难题
  • ¥15 用matlab 设计一个不动点迭代法求解非线性方程组的代码
  • ¥15 牛顿斯科特系数表表示
  • ¥15 arduino 步进电机
  • ¥20 程序进入HardFault_Handler
  • ¥15 oracle集群安装出bug
  • ¥15 关于#python#的问题:自动化测试
  • ¥20 问题请教!vue项目关于Nginx配置nonce安全策略的问题
  • ¥15 教务系统账号被盗号如何追溯设备
  • ¥20 delta降尺度方法,未来数据怎么降尺度