编程Python数据分析与应用

1、读取文件team.xlsx数据，其中'name'：名字, 'team'：所属团队, '1'：语文分数, '2'：数学分数, '3'：英语分数, '4'：政治分数，完成以下任务：
（1）查询该数据的索引、所有值、列名、数据类型、元素个数、维度以及形状。
（2）访问该数据中’name’、’team’中的前5行数据。
（3）访问该数据所属团队为B组中的成员名字，并筛选出B组中'1'大于60分的同学。
（4）在文件最后添加一列’tol’，意为该成员的四门课的分数总和。
（5）对数值型和’team’列数据分别进行描述性统计。
（6）对该数据按所属团队进行分类，查看每个团队的大小，并计算每个团队的1', '2', '3', '4'四门课的总分和平均分。

2、读取文件team.xlsx数据，其中'name'：名字, 'team'：所属团队, '1'：语文分数, '2'：数学分数, '3'：英语分数, '4'：政治分数，完成以下任务：
（1）画出'1'、 '2'、'3'、 '4'四门课分数的散点图和折线图。
（2）按所属团队进行分类，画出每个团队四门课平均分的直方图、饼图和箱线图。

3、读取文件countries-aggregated.csv数据，其中'Date'：日期, 'Country'：国家, 'Confirmed'、 'Recovered'、 'Deaths'：当日累计确诊、康复、死亡人数，完成以下任务：
（1）查询中国、美国的累计确诊人数，并画出折线图。
（2）查询2020/5/4日确诊病例在1万以上的国家中死亡率（死亡人数/确诊人数）排名前十的国家，并画出直方图。

4、import pandas as pd
pd.Series(pd.date_range('1920','2021'))
使用以上语句生成100年的时间序列，完成以下操作：
（1）找出100年中的劳动节
（2）计算出劳动节分别为星期一到星期日的天数。
（3）绘制劳动节分别为星期一到星期日的天数数量的直方图。

[](链接: https://pan.baidu.com/s/17RH-XmqBgeUCiLQJqXwx0Q?pwd=3sep 提取码: 3sep )

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

溪风沐雪 2022-06-09 22:23

关注

这题目内容太多了，折腾半天，可能有些理解不一定正确，仅供参考

#1、读取文件team.xlsx数据，其中'name'：名字, 'team'：所属团队, '1'：语文分数, '2'：数学分数, '3'：英语分数, '4'：政治分数，完成以下任务：
import pandas as pd
df = pd.read_excel('team.xlsx')

#（1）查询该数据的索引、所有值、列名、数据类型、元素个数、维度以及形状。
print(f'索引：{df.index}')
print(f'所有值：{df[::]}')
print(f'列名：{",".join([c for c in df.columns])}')
print(f'数据类型：{[type(x) for x in df[0:]]}')
print(f'元素个数：{len(df.index)}')
print(f'维度：{[c for c in df.columns][1:]}')
print(f'形状：{df[::].shape}')

#（2）访问该数据中’name’、’team’中的前5行数据。
top5 = df[['name','team']][:5]
print(top5)

# （3）访问该数据所属团队为B组中的成员名字，并筛选出B组中'1'大于60分的同学。
# B组成员
b_lst = df[df['team']=='B'].loc[:,'name']
print(b_lst.to_list())
#B组中'1'大于60分的同学
df = df[df['team']=='B']
b_lst1 = df[df['Q1']>60].loc[:,'name']
print(b_lst1.to_list())

# （4）在文件最后添加一列’tol’，意为该成员的四门课的分数总和。
data = df[['Q1','Q2','Q3','Q4']]
tol = [data.loc[i].sum() for i in data.index]
df['tol'] = tol
print(df)

# （5）对数值型和’team’列数据分别进行描述性统计。
print(f'A组成员占总人数{len(df[df["team"]=="A"].index)/len(df.index)*100}%')
print(f'B组成员占总人数{len(df[df["team"]=="B"].index)/len(df.index)*100}%')
print(f'C组成员占总人数{len(df[df["team"]=="C"].index)/len(df.index)*100}%')
print(f'D组成员占总人数{len(df[df["team"]=="D"].index)/len(df.index)*100}%')
print(f'E组成员占总人数{len(df[df["team"]=="E"].index)/len(df.index)*100}%')
print(f'语文成绩及格率{len(df[df["Q1"]>=60].index)/len(df.index)*100}%')
print(f'数学成绩及格率{len(df[df["Q2"]>=60].index)/len(df.index)*100}%')
print(f'英语成绩及格率{len(df[df["Q3"]>=60].index)/len(df.index)*100}%')
print(f'政治成绩及格率{len(df[df["Q4"]>=60].index)/len(df.index)*100}%')

# （6）对该数据按所属团队进行分类，查看每个团队的大小，并计算每个团队的1', '2', '3', '4'四门课的总分和平均分。
a = df[df["team"]=="A"]
b = df[df["team"]=="B"]
c = df[df["team"]=="C"]
d = df[df["team"]=="D"]
e = df[df["team"]=="E"]

for i,t in zip([a,b,c,d,e],['A','B','C','D','E']):
    num = len(i.index)
    sum_1 = i["Q1"].sum()
    avg_1 = round(sum_1/num,2)
    sum_2 = i["Q2"].sum()
    avg_2 = round(sum_2/num,2)
    sum_3 = i["Q3"].sum()
    avg_3 = round(sum_3/num,2)
    sum_4 = i["Q4"].sum()
    avg_4 = round(sum_4/num,2)
    print(f'团队{t}有{num}人,语文总分/平均分：{sum_1}/{avg_1},数学总分/平均分：{sum_2}/{avg_2},英语总分/平均分：{sum_3}/{avg_3},政治总分/平均分：{sum_4}/{avg_4}')

# 2、读取文件team.xlsx数据，其中'name'：名字, 'team'：所属团队, '1'：语文分数, '2'：数学分数, '3'：英语分数, '4'：政治分数，完成以下任务：
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df = pd.read_excel('team.xlsx')
# （1）画出'1'、 '2'、'3'、 '4'四门课分数的散点图和折线图。
plt.rcParams['axes.unicode_minus']=False
plt.rcParams['font.sans-serif']=['SimHei']
#散点图
ax1 = df.plot.scatter(x='name', y='Q1', color='r', label='Q1')
df.plot.scatter(x='name', y='Q2', color='b', label='Q2', ax=ax1)
df.plot.scatter(x='name', y='Q3', color='y', label='Q3', ax=ax1)
df.plot.scatter(x='name', y='Q4', color='g', label='Q3', ax=ax1)
plt.xticks('')
#折线图
df.plot(kind='line',x='name', y=['Q1', 'Q2', 'Q3', 'Q4'],subplots=True,layout=(2, 2),figsize=(10, 5))
plt.show()

# （2）按所属团队进行分类，画出每个团队四门课平均分的直方图、饼图和箱线图。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df = pd.read_excel('team.xlsx')
a = df[df["team"]=="A"]
b = df[df["team"]=="B"]
c = df[df["team"]=="C"]
d = df[df["team"]=="D"]
e = df[df["team"]=="E"]
a_avg = [round(a[q].sum()/len(a.index),2) for q in ['Q1','Q2','Q3','Q4']]
b_avg = [round(b[q].sum()/len(b.index),2) for q in ['Q1','Q2','Q3','Q4']]
c_avg = [round(c[q].sum()/len(c.index),2) for q in ['Q1','Q2','Q3','Q4']]
d_avg = [round(d[q].sum()/len(d.index),2) for q in ['Q1','Q2','Q3','Q4']]
e_avg = [round(e[q].sum()/len(e.index),2) for q in ['Q1','Q2','Q3','Q4']]
df_hist = pd.DataFrame({'A':a_avg, 'B':b_avg, 'C':c_avg, 'D':d_avg, 'E':e_avg}, columns=['A','B','C','D','E'],index=['Q1','Q2','Q3','Q4'])
#直方图
df_hist.hist(color='r', alpha=0.5, bins=20)
#饼图
df_hist.plot.pie(subplots=True, figsize=(10, 5))
#箱线图
df_hist.plot.box(figsize=(10, 5))
plt.show()

# 3、读取文件countries-aggregated.csv数据，其中'Date'：日期, 'Country'：国家, 'Confirmed'、 'Recovered'、 'Deaths'：当日累计确诊、康复、死亡人数，完成以下任务：
# （1）查询中国、美国的累计确诊人数，并画出折线图。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.read_csv('countries-aggregated.csv')
plt.rcParams['axes.unicode_minus']=False
plt.rcParams['font.sans-serif']=['SimHei']
cn = df[df['Country']=='China']
us = df[df['Country']=='US']
plt.figure(figsize=(9,6))
plt.title('中国、美国的累计确诊人数')
plt.plot(cn.loc[:,'Date'], cn.loc[:,'Confirmed'], color='green', label='China')
plt.plot(cn.loc[:,'Date'], us.loc[:,'Confirmed'], color='red', label='US')
plt.ylabel('确诊人数(百万)')
plt.xlabel('日期')
plt.yticks(range(0,1500000,100000))
plt.xticks(cn.loc[:,'Date'][::10],)
plt.show()
# （2）查询2020/5/4日确诊病例在1万以上的国家中死亡率（死亡人数/确诊人数）排名前十的国家，并画出直方图。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.read_csv('countries-aggregated.csv')
plt.rcParams['axes.unicode_minus']=False
plt.rcParams['font.sans-serif']=['SimHei']
data = df[df['Date']=='2020/5/4'][df['Confirmed']>10000]
data['newc'] = pd.DataFrame(df['Deaths']/df['Confirmed'])
data.sort_values(by="newc" , inplace=True, ascending=False)
top10 = data.head(10)['newc']
top10.hist(color='r', alpha=0.5, bins=25)
plt.show()

# 4、import pandas as pd
# pd.Series(pd.date_range('1920','2021'))
# 使用以上语句生成100年的时间序列，完成以下操作：
# （1）找出100年中的劳动节
import pandas as pd
import time
import matplotlib.pyplot as plt
dates = pd.Series(pd.date_range('1920','2021'))
lst = [str(d).split(' ')[0] for d in list(dates) if '-05-01' in str(d)]
print(lst)
# （2）计算出劳动节分别为星期一到星期日的天数。
lst = [time.strptime(str(d), "%Y-%m-%d %X").tm_wday for d in list(dates) if '-05-01' in str(d)]
weeks = ['星期日','星期一','星期二','星期三','星期四','星期五','星期六']
weekinfo = {weeks[i]:lst.count(i) for i in range(7)}
print(weekinfo)
# （3）绘制劳动节分别为星期一到星期日的天数数量的直方图。
plt.rcParams['axes.unicode_minus']=False
plt.rcParams['font.sans-serif']=['SimHei']
plt.hist(weekinfo.values())
plt.show()

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

报告相同问题？

关注问题

Python编程：数据分析与机器学习
2025-03-19 10:26

内容涵盖了Python的基础知识、安装与配置、继承与类、循环、Pandas数据分析、机器学习基础、算法、类、数据文件处理、错误处理、注释与文档编写、感知器、数据分析技巧以及常见编程错误的避免方法。作者Eric Wall...
python数据分析与可视化.pdf
2024-02-28 09:15

它拥有丰富的标准库和第三方库，可以用于各种应用，包括Web开发、数据分析、机器学习、科学计算、网络编程、自动化运维等。以下是一些Python的基本特性：易于学习：Python有相对较少的关键字，结构简单，和一个...
Python编程语言的基础概念与应用概述
2024-12-06 15:40

内容概要：本文档详尽介绍了Python的基本历史背景和发展脉络，从Python语言的概念介绍出发，探讨了Python作为一门高级编程语言的独特优势及其广泛的应用范围，涵盖了Web开发、数据分析等多个方向。此外，文档还提及...
数据分析领域-Python编程语言-NumPy数据处理-参考资料
2024-03-24 15:28

这是专门适用于大学生的编程语言的代码库的使用说明，用于线性代数的学习与理解，大学生计算机竞赛，Python的学习与使用，数据处理等
【Python编程与数据分析】高级Python编程实战与数据分析项目全套教程：核心语法、实战应用及项目开发指南
2025-08-03 19:34

内容概要：本教程系统全面地讲解了Python语言的核心语法、面向对象编程、函数式编程及在数据分析、机器学习领域的实战应用。教程从Python基础语法入手，逐步深入到面向对象编程、函数式编程、异常处理、文件操作、...
数据分析编程语言：Python.zip
2024-08-19 08:25

史上最全编程语言全套教程，共99门编程语言，包括：函数式编程语言 ...数据分析编程语言 数据库查询语言系统编程语言 脚本编程语言 逻辑编程语言 面向对象编程语言 等所有常见的变成语言系列教程
Python编程语言在数据分析中的运用.pdf
2021-06-28 16:29

Python编程语言在数据分析中的应用已经成为了一项重要的技能，不仅因为Python本身语言特性的强大功能和简单操作，更因为其在处理数据方面的独特优势。Python语言在数据分析领域的运用，从数据的爬取、清洗、预处理，...
编程语言Python核心特性与应用领域详解：从基础语法到项目实战Python编程语言的核心
2025-06-25 20:40

在实际应用方面，文章通过数据分析与处理、Web 开发实战、自动化脚本编写三个案例，展示了 Python 在不同场景中的强大功能。最后，推荐了一些优质的 Python 学习资源，并展望了 Python 的未来发展前景。适合人群：...
Python编程语言基础知识与应用详解
2024-12-09 15:20

此外，还探讨了Python在Web开发、数据分析、人工智能和自动化运维等领域的实际应用案例。适合人群：适合Python初学者、希望深入了解Python编程的技术人员。使用场景及目标：适用于需要系统学习Python编程的新手...
【编程语言基础】编程语言Python基础语法与数据结构入门：初学者核心知识点教学指导
2025-12-29 00:16

内容概要：本文档为《Python基础知识1.1.1.pdf》，主要介绍了Python编程语言的基础知识，涵盖基本语法、数据类型、变量定义、运算符、流程控制语句（如条件判断与循环）、函数定义与调用、常用内置数据结构（如列表...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 6月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 6月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金10元 6月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 6月9日
展开全部

编程Python数据分析与应用

1条回答 默认 最新

问题事件

1条回答默认最新