Python遍历文件夹的文件提取关键信息到新的表格

各位大神好，小弟目前在自学Python处理办公的一些数据，遇到一个问题：
假设目前有一份excel数据，格式为
df = ['ID', 'Name', 'Tracking Number'], 大概几千行这样；
另一个文件夹A下面有名称格式包含生成日期的多个CSV数据文件，格式为
df1 = ['Num1', 'Num2', 'Num3', 'Tracking Number'];
现在想根据df这里面的Tracking Number这一列的数据，去遍历文件夹A下面的所有CSV文件找到对应的Num1，Num2， Num3并且提取到df里面对应的行。

我目前尝试的方法是将A文件夹下所有文件合并成一个df，去重后再根据TrackingNumber使用merge函数拼接过去，这样的话随着A文件夹文件数量增多生成的合并df会很大，运行很慢，步骤过于繁琐，想请教一下各位有没有快捷点的方法可以实现？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
手打天下_001 2019-03-04 18:21
关注
不需要对A文件夹进行任何改动，
1.可以遍历A文夹件中的文件(参考os.walk())，将遍历结果存为一个字典或是列表
2.字典或是列表内容，打开对应的文件
3.根据关键字得对得应的结果
4.输出，并关闭文件

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

遍历csv文件，提取相关数据？ python 有问必答
2021-12-26 19:26

回答 2 已采纳如果确保都是这种形式，可以这样处理 d = eval(data[i][3]) for i in d: print(i)
python从txt中提取关键字所在行，并删除重复项后生成新的txt python
2022-05-16 17:32

回答 1 已采纳尝试用了write函数，但是最终txt文件中只有最后一行数据你这里已经很接近了比如说 with open('save.txt','a') as f1: f1.write('你要写入的数据'
你们好，我想问下，python批量从每个文件夹下随机选取一张图片，保存至新的文件夹，用下面代码怎么实现？ python 有问必答
2022-03-28 20:21

回答 2 已采纳你代码貌似已经是这种逻辑啦。大概逻辑1、写个过程选择目录下的随机文件，复制到指定目录2、遍历工作目录下的所有子目录到列表遍历在这个列表，调用1代码建议用插入代码功能贴下代码
python遍历文件夹中所有文件名写入excel文件
2019-01-10 10:17

python写的小程序，用于将一个文件夹下所有文件名（包括子文件夹中的文件）提取到excel中，每个子文件夹生成一个excel工作表
python提取多个文件夹中特定名称的图片放在新建文件夹里并重命名 python
2020-09-22 10:29

回答 1 已采纳 os.rename()，这个api里面传入的两个参数，不是文件名，是文件的全路径名称
python搜索文本文件并分析导出内容结果出错 python tcp/ip windows
2023-02-21 17:32

回答 2 已采纳由于没人回答，经不懈努力，终于成功解决了以上问题，虽然还很不成熟，希望能抛砖引玉。主要改进是：放弃了字典存储模式，用理简单的列表存储结果，以简化逻辑。本人是Python的初学者，以学为目的，主要用于解
python PDF2TXT，提取到TXT的字序混乱，请教怎么修改？ python
2022-10-26 12:56

回答 1 已采纳这个问题解决了，聚合器的值取大一点，laparams = LAParams(char_margin=20.0)
python 遍历文件夹 提取文件内信息存为新文件名_python获取遍历文件名称并分别保存为XLSX和CSV格式...
2020-12-15 06:54

weixin_39859909的博客 import osimport xlwt # 操作excel模块import sysfile_path = sys.path[0] + '\\filename.xls' # sys.path[0]为要获取当前路径，filename为要写入的文件f = xlwt.Workbook(encoding='utf-8', style_compression=0) #...
关于python调用百度api接口识别身份证信息 python 有问必答百度云
2022-01-22 22:27

回答 7 已采纳你题目的解答代码如下： import pandas as pd res={ "log_id": 2648325511, "direction": 0, "image_stat
python 自动下载阿里邮箱中已转入其他文件中的邮件的附件 python
2022-02-22 15:13

回答 2 已采纳相关的imaplib的环境，使用的IMAP的模式来进行管理。POP3 是表示仅下载邮件，并不具备管理文件夹的权限。然后你可以使用IMAP4 就是正常的模式，不带有SSL方式进行操作。就是m=imap
文件提取代码无法运行，请求修改意见及原理 python 后端开发语言
2022-02-03 21:34

回答 1 已采纳朋友，我在你最后一张图的代码中，于原本的17行（else部分）做出了修改，原理是：提取list中的str参与判断，而非直接用list去参与判断（list比str类型不同） import os impo
python遍历文件夹下的所有子文件夹，并将指定的文件复制到指定目录
2023-08-30 10:05

计算机CV民工的博客 python遍历文件夹下的所有子文件夹，并将指定的文件复制到指定目录需求复制单个文件夹 遍历所有子文件夹中的文件，并复制代码封装需求在1文件夹中有1，2两个文件夹 将这两个文件夹中的文件复制到 after_copy中 ...
python 运行这段代码进入循环后退出 python 有问必答
2022-03-12 10:37

回答 3 已采纳你的意思是函数执行后没有打印输出还是?TranslateFile函数需要读取.\dst_dir目录下的文件读取,读取的PDF类文件,你的目录下放置文件了吗,还是路径不对
python 遍历文件夹下全部文件并选择不同类型
2022-09-16 11:16

Y_z001的博客 python实现文件夹遍历并实现所需后缀文件的路径提取
Python3.遍历某文件夹提取特定文件名的实例
2020-09-20 13:35

下面小编就为大家分享一篇Python3.遍历某文件夹提取特定文件名的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
没有解决我的问题, 去提问

悬赏问题

¥15 一道python难题
¥15 用matlab 设计一个不动点迭代法求解非线性方程组的代码
¥15 牛顿斯科特系数表表示
¥15 arduino 步进电机
¥20 程序进入HardFault_Handler
¥15 oracle集群安装出bug
¥15 关于#python#的问题：自动化测试
¥20 问题请教！vue项目关于Nginx配置nonce安全策略的问题
¥15 教务系统账号被盗号如何追溯设备
¥20 delta降尺度方法，未来数据怎么降尺度

Python遍历文件夹的文件提取关键信息到新的表格

1条回答 默认 最新

悬赏问题

1条回答默认最新