python数据处理

有一批excel表格，里面有很多列数据，第一行是列名。希望用python写代码，对每一列数据进行排序，降序。然后对每一列进行数据筛选，从每列数据最小值开始，去掉总数据的25%，保留最大值那部分75%，最终输出一个新表格，表格里的数据是排序(降序)好的，去掉下最小的25%的数值，列名与原名数据表格表头一致。去除数据的比例的参数可以让我自行

调整。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
「已注销」 2023-03-07 19:13
关注
参考GPT和自己的思路，你可以使用pandas和numpy库来完成这个任务。以下是一个可能的解决方案：

import os import pandas as pd # 指定文件夹路径 folder_path = '/path/to/folder/' # 获取文件夹中所有Excel文件 excel_files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')] # 定义去除数据比例 data_percentage = 0.25 # 循环处理每个Excel文件 for file_name in excel_files: # 读取Excel文件 df = pd.read_excel(os.path.join(folder_path, file_name)) # 对每一列进行排序 sorted_df = df.apply(lambda x: x.sort_values(ascending=False).values) # 去除每一列的最小25%数据 filtered_df = sorted_df.apply(lambda x: x[int(len(x)*data_percentage):]) # 将处理后的数据保存到新的Excel文件中 new_file_name = 'sorted_filtered_' + file_name filtered_df.to_excel(os.path.join(folder_path, new_file_name), index=False)

首先使用pandas的read_excel函数读取原始表格数据，然后使用apply函数对每一列数据进行排序（使用numpy的sort函数实现），并将结果保存在df_sorted中。

接下来，使用apply函数和numpy的min和max函数分别计算每列数据的最小值和最大值，然后使用一个自定义的lambda函数，对每列数据进行筛选，去掉最小的25%的数据，将结果保存在df_filtered中。

最后，使用DataFrame函数构建一个新的表格，并将df_filtered的数据倒置后，赋值给新表格的各列，最后使用pandas的to_excel函数将新表格输出到一个excel文件中。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

Python编程从入门到精通-pdf
2024-10-06 09:50

Python编程语言是一种广泛使用的高级编程语言，以其简洁明了的语法和强大的功能支持而著称，非常适合于初学者入门学习编程，同时也被广泛应用于数据科学、人工智能、网络开发等多个专业领域。《Python编程从入门到...
Python 数据处理库 pandas 入门教程基本操作
2020-09-20 14:25

pandas是一个Python语言的软件包，在我们使用Python语言进行机器学习编程的时候，这是一个非常常用的基础编程库。本文是对Python 数据处理库 pandas 入门教程,非常不错，感兴趣的朋友一起看看吧
Python与传统编程语言的区别
2024-08-04 10:10

不会倒的鸡蛋的博客 Python与传统编程语言的区别
使用Python进行大规模数据处理和分析
2024-05-27 01:53

一键难忘的博客在本文中，我们深入探讨了如何利用Python进行大规模数据处理和分析。我们首先介绍了Python在这一领域的优势，包括其开源生态系统、并行处理能力和数据可视化能力。随后，我们通过具体的代码示例展示了如何处理不同...
【Python入门系列】第九篇：Python数据分析和处理
2023-07-05 08:16

杰西笔记的博客 Python数据分析和处理是当今数据科学...Python作为一种功能强大且易于上手的编程语言，提供了丰富的数据分析和处理工具和库，如pandas、numpy、matplotlib等。本文将介绍Python数据分析和处理的基础知识和常用操作。
python数据预处理
2022-07-30 20:30

黑小慕的博客 python数据预处理（缺失值处理，异常值处理，特征分析，标准化/归一化处理，相关性分析）
最流行的编程入门语言Python科学计算与数据处理python科学计算软件.pdf
2023-10-14 17:19

最流行的编程入门语言Python科学计算与数据处理python科学计算软件.pdf
python趣味编程100例（99个）
2018-04-06 11:27

Python是一种广泛应用于科学计算、数据分析、人工智能以及web开发等领域的高级编程语言，因其简洁明了的语法特性，常被称为“胶水语言”，能够轻松地连接各种组件。"Python趣味编程100例（99个）"这个资源显然是为了...
用于自然语言处理的 Python：理解文本数据
2023-09-26 19:46

无水先生的博客 Python是一种功能强大的编程语言，在自然语言处理（NLP）领域获得了极大的普及。凭借其丰富的库集，Python 为处理和分析文本数据提供了一个全面的生态系统。在本文中，我们将介绍 Python for NLP 的一些基础知识，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月7日

python数据处理

3条回答 默认 最新

问题事件

3条回答默认最新