python做数据统计

比如说在/home/zhang目录下很多txt文件，文件中格式都是这样几个字段。

性别，年龄，籍贯，总分，语文，数学

性别10为男，0为女
年龄，总分，语文，数学的值都是数字
籍贯的格式为，湖南省长沙市，北京市朝阳区，类似这种

比如统计几个指标。
语文成绩大于等于60的学生总数，男生人数，女生人数

湖南省湘潭市最高分女生学生姓名，

湖南省株洲市学生平均分。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

图说交通 2024-07-05 15:12

关注


import pandas as pd
import os

# 获取指定目录下所有txt文件的列表
def get_txt_files(directory):
    return [os.path.join(directory, f) for f in os.listdir(directory) if f.endswith('.txt')]

# 读取所有txt文件并合并到一个DataFrame
def read_txt_files(file_list):
    dfs = [pd.read_csv(file, sep=',', header=None, names=['性别', '年龄', '籍贯', '总分', '语文', '数学']) for file in file_list]
    return pd.concat(dfs, ignore_index=True)

# 统计指标函数
def calculate_statistics(df):
    # 语文成绩大于等于60的学生总数
    total_students_above_60 = len(df[df['语文'] >= 60])
    
    # 男生和女生人数
    male_count = len(df[df['性别'] == 10])
    female_count = len(df[df['性别'] == 0])
    
    # 湖南省湘潭市最高分女生学生姓名
    max_score_female_xiangtan = df[(df['性别'] == 0) & (df['籍贯'] == '湖南省湘潭市')].nlargest(1, '总分')['姓名']
    # 假设学生姓名字段存在，如果不存在则需调整逻辑或提前处理数据
    
    # 湖南省株洲市学生平均分
    average_score_zhuzhou = df[df['籍贯'] == '湖南省株洲市']['总分'].mean()
    
    return total_students_above_60, male_count, female_count, max_score_female_xiangtan, average_score_zhuzhou

# 主程序
if __name__ == "__main__":
    directory = "/home/zhang"
    txt_files = get_txt_files(directory)
    combined_df = read_txt_files(txt_files)
    
    # 确保籍贯列是字符串格式，以便进行文本匹配
    combined_df['籍贯'] = combined_df['籍贯'].astype(str)
    
    total_students_above_60, male_count, female_count, max_score_female_xiangtan, average_score_zhuzhou = calculate_statistics(combined_df)
    
    print(f"语文成绩大于等于60的学生总数: {total_students_above_60}")
    print(f"男生人数: {male_count}")
    print(f"女生人数: {female_count}")
    
    if not max_score_female_xiangtan.empty:
        print(f"湖南省湘潭市最高分女生学生姓名: {max_score_female_xiangtan.iloc[0]}")
    else:
        print("湖南省湘潭市没有符合条件的女生")
    
    print(f"湖南省株洲市学生平均分: {average_score_zhuzhou:.2f}")

报告相同问题？

关注问题

Python编程语言中:f的含义 python 开发语言
2021-11-05 17:43

回答 3 已采纳 f-string采用 {content:format} 设置字符串格式，其中 content 是替换并填入字符串的内容，可以是变量、表达式或函数等，format 是格式描述符.具体函数可以参考看
Python编程语言 list python 有问必答
2021-12-29 11:00

回答 2 已采纳 import random n=int(input()) list=[] for i in range(n): list.append(random.randint(1,200)) print
python编程语言中的基础知识 python
2022-12-10 22:55

回答 2 已采纳 # 判断一个数是否为素数 def isprime(x): # 1不是素数 if x == 1: return False # 判断 x 是否能被 2 到 sq
基于Python语言的数据统计分析设计源码
2024-10-09 04:54

该项目是一款基于Python语言的数据统计分析设计源码，集成了23个文件，涵盖15个xlsx数据文件和6个Python源代码文件，此外还包括1个DS_Store和1个md文件。该设计旨在进行高效的数据统计分析，适用于各类数据分析任务...
用python语言，统计20个学生的成绩 python
2022-04-14 12:03

回答 2 已采纳一个实现，供参考： grade=input("请输入20个学生成绩，以逗号分隔:") grade=grade.split(',') #将输入读取转换成列表 #初始化最大值，最小值，以及和 max
python编程数据分析 python
2022-05-26 00:03

回答 1 已采纳 d = {} dial_clean='15 年已经成为中国全力推进一带一路构想的新起点亚欧互联互通的政策沟通设施联通贸易畅通资金融通民心相通五大领域
Python编程，怎么做啊！ python
2021-12-20 23:32

回答 1 已采纳代码可这样写： lis=list(map(int,input().split())) print(sorted(lis,reverse=True)) result=1 for x in lis:
Python制作编程语言20年动态排行榜
2022-04-20 17:07

Python是一种广泛应用于各种领域的高级编程语言，特别是在数据分析、科学计算、机器学习以及Web开发中有着极高的声誉。自1991年由Guido van Rossum创造以来，Python经历了二十多年的发展，逐渐成为全球最受欢迎的...
python统计数据 python
2022-05-10 16:29

回答 4 已采纳 m=int(input()) n=int(input()) a=[x for x in range(m,n+1) if x%3==2 or x==6] printf(len(a))
Python编程题怎么做呀 python
2021-09-26 15:09

回答 2 已采纳不难啊，你是没思路还是什么呢？
python完成数据统计 python
2022-06-02 23:51

回答 1 已采纳 import random nums = random.choices(range(100,1000),k=100) s = ','.join(map(str,nums)) with open(r'C
My-Python：Python是一种编程语言
2021-02-25 01:40

Python是一种广泛使用的高级编程语言，以其易读性强、语法简洁而闻名。它的设计哲学强调代码的可读性和简洁的语法，使得Python成为初学者入门编程的理想选择，同时也被专业人士广泛应用于各种复杂项目。在"我的...
Python程序车牌统计问题 python 开发语言
2022-04-01 12:25

回答 1 已采纳 #问题在于5777,77只算出现了一次，要是7777，也只算一次？ li = ["YE5777","YB5677","YC8367","YA77B3",] res=[] temp = set()
用python实现简单EXCEL数据统计的实例
2020-12-23 23:28

用python时间简单的统计任务-统计男性和女性分别有多少人。用到的物料：xlrd 它的作用-读取excel表数据代码： import xlrd workbook = xlrd.open_workbook('demo.xlsx') #打开excel数据表 SheetList = workbook....
人工智能最火编程语言 Python大战Java!
2020-09-21 02:02

在探讨人工智能领域最火的编程语言时，Python与Java之间的竞争尤为引人关注。开发者在选择学习编程语言时，往往会在两者之间犹豫不决，尤其是针对机器学习和数据科学这样的高技术领域。根据分析，我们可以得出一些...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月5日

悬赏问题

¥15 短剧的sdk在哪里接入
¥15 求：可不可以提供一些在国内可以用，低代码不要太难在电脑上可以下载的制作app的软件
¥60 找人回答kibana8.14.3二次集成开发，自定义插件ui导航栏如何设置
¥15 fluke高精度万用表8845A型号测交流电压一直跳动，且去掉输入后显示不归零
¥15 不同模型怎么用同一个shader
¥15 安卓启动没有ais proxy与v4l2的log打印
¥15 go怎么读取mdb文件里面的数据
¥60 Matlab联合CRUISE仿真编译dll文件报错
¥15 脱敏项目合作，ner需求合作
¥15 脱敏项目合作，ner需求合作

python做数据统计

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新