各位大神好,小弟目前在自学Python处理办公的一些数据,遇到一个问题:
假设目前有一份excel数据,格式为
df = ['ID', 'Name', 'Tracking Number'], 大概几千行这样;
另一个文件夹A下面有名称格式包含生成日期的多个CSV数据文件,格式为
df1 = ['Num1', 'Num2', 'Num3', 'Tracking Number'];
现在想根据df这里面的Tracking Number这一列的数据,去遍历文件夹A下面的所有CSV文件找到对应的Num1,Num2, Num3并且提取到df里面对应的行。
我目前尝试的方法是将A文件夹下所有文件合并成一个df,去重后再根据TrackingNumber使用merge函数拼接过去,这样的话随着A文件夹文件数量增多生成的合并df会很大,运行很慢,步骤过于繁琐,想请教一下各位有没有快捷点的方法可以实现?