本人在校学生 自学不太明白 经过本人不严谨测试发现问题出在df.to_excel这里 因为写入的数据大概在90+列 50w+行 导致一直卡在这里 具体多久跑完不知道(跑了几十分钟没跑完)并且16g内存爆满
有没有可以提升处理效率的方法
感激不尽
for file_name_csv in os.listdir(Excel_csv_folder):
if file_name_csv.endswith('.csv'):
df = pd.read_csv(os.path.join(Excel_csv_folder, file_name_csv))
xlsx_filename = file_name_csv.replace('.csv', '.xlsx')
df.to_excel(os.path.join(Excel_elsx_folder, xlsx_filename), index=False)
for file_name in os.listdir(Excel_elsx_folder):
if file_name.endswith('.xlsx'):
excel_file_path =os.path.join(Excel_elsx_folder,file_name)
# 读取Excel文件
df = pd.read_xlsx(excel_file_path)
# 遍历B列的每一行元素,匹配字典中的值,并将对应的键写入A列相同的行
for index, row in df.iterrows():
# 获取B列的元素值
value_in_D = row['Indicator Code']
# 在字典中查找匹配的键
corresponding_key_IDC = IDC_dict.get(value_in_D)
if corresponding_key_IDC != None:
df.at[index,'Indicator Code'] = corresponding_key_IDC
# 将修改后的DataFrame写回Excel文件
df.to_xlsx(excel_file_path, index=False)