weixin_44595896
weixin_44595896
采纳率40%
2019-03-04 15:42 阅读 1.3k

Python遍历文件夹的文件提取关键信息到新的表格

各位大神好,小弟目前在自学Python处理办公的一些数据,遇到一个问题:
假设目前有一份excel数据,格式为
df = ['ID', 'Name', 'Tracking Number'], 大概几千行这样;
另一个文件夹A下面有名称格式包含生成日期的多个CSV数据文件,格式为
df1 = ['Num1', 'Num2', 'Num3', 'Tracking Number'];
现在想根据df这里面的Tracking Number这一列的数据,去遍历文件夹A下面的所有CSV文件找到对应的Num1,Num2, Num3并且提取到df里面对应的行。

我目前尝试的方法是将A文件夹下所有文件合并成一个df,去重后再根据TrackingNumber使用merge函数拼接过去,这样的话随着A文件夹文件数量增多生成的合并df会很大,运行很慢,步骤过于繁琐,想请教一下各位有没有快捷点的方法可以实现?

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享

1条回答 默认 最新

  • guoyan11 手打天下_001 2019-03-04 18:21

    不需要对A文件夹进行任何改动,
    1.可以遍历A文夹件中的文件(参考os.walk()),将遍历结果存为一个字典或是列表
    2.字典或是列表内容,打开对应的文件
    3.根据关键字得对得应的结果
    4.输出,并关闭文件

    点赞 评论 复制链接分享

相关推荐