实验七：Pandas要有实验截图和代码

实验七：Pandas
Pandas的两大核心数据结构

Pandas是基于Numpy开发出的,专门用于数据分析的开源Python库
Series(一维数据)

DataFrame(多特征数据,既有行索引,又有列索引)

DataFrame的属性

Panda数据读取(以csv为例)
pandas.read_csv(filepath_or_buffer, sep=",", names=None, usecols = None)
filepath_or_buffer : 文件路径(本地路径或url路径) sep: 分隔符 names: 列索引的名字 usecols: 指定读取的列名返回的类型: DataFrame

Dataframe通过布尔索引过滤数据

小案例: 分析2006年至2016年1000部IMDB电影数据

2006年-2016年IMDB最受欢迎的1000部电影

评分降序排列

统计时长
IMDB_1000 = pd.read_csv("./IMDB-Movie-Data.csv") # 获取数据字段 print(IMDB_1000.dtypes) # 根据1000部电影评分进行降序排列,参数ascending, 默认为True(升序), 这里为False(降序) IMDB_1000.sort_values(by="Rating", ascending=False) # 时间最长的电影 IMDB_1000[IMDB_1000["Runtime (Minutes)"]==IMDB_1000["Runtime (Minutes)"].max()] # 时间最短的电影 IMDB_1000[IMDB_1000["Runtime (Minutes)"]==IMDB_1000["Runtime (Minutes)"].min()] # 电影时长平均值 IMDB_1000["Runtime (Minutes)"].mean()
数据处理
存在缺失值, 直接删除数据(删除存在缺失值的样本)

存在缺失值, 直接填充数据fillna

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

12条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2023-12-04 22:30
关注
获得0.90元问题酬金

【数据处理】Pandas读取CSV文件示例及常用方法（入门）_鹏阿鹏的博客-CSDN博客文章浏览阅读2.3w次，点赞60次，收藏588次。1. 导入常用包import pandas as pdimport numpy as npimport matplotlib.pyplot as plt%matplotlib inlineimport datetime2. 文件读取data = pd.read_csv('./数据集/北京空气_2010.1.1-2014.12.31.csv')3. 查看有哪些列data.head()_pandas读取csv文件 https://blog.csdn.net/AwesomeP/article/details/124975721

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python编程语言大学教学实验内容
2025-06-10 10:09

Python编程语言作为当今最为流行的编程语言之一，其简洁清晰的语法和强大的功能库使得它在教育领域被广泛采用。在大学教学中，Python不仅适用于计算机专业的编程教学，也被越来越多地引入到其他非计算机专业的课程中...
Python实验报告：Python和Matlab
2023-11-02 14:30

首先，Python是一种高级编程语言，以其易读性、可扩展性和丰富的库而闻名。在科学计算领域，Python的NumPy、SciPy和Pandas等库提供了高效的数据处理和分析能力。例如，NumPy库支持多维数组操作，是进行数值计算的...
中南大学实验和课程设计代码.zip
2024-06-01 19:36

5. 编程语言基础：如C++、Java、Python等，理解代码的基础语法和编程思想。二、实验（experiment）实验部分是学生动手实践的关键环节，它可能涵盖了多种课程的实验项目，如操作系统、网络、数据库等，涉及的知识...
Python机器学习编程与实战_源代码和实验数据.rar
2022-07-10 13:51

- 第1章：通常涵盖Python的基础知识，如变量、数据类型、控制流等，这是学习任何编程语言的第一步，为后续的机器学习代码编写做好准备。 - 第2章：可能介绍了Python的数据科学库，如NumPy、Pandas和Matplotlib，这些...
组流技术与流特征分析实验源代码
2024-10-19 18:34

组流技术与流特征分析实验源代码是涉及网络测量实验的一部分，主要是针对网络流量数据的收集和分析，以研究网络中数据流动的模式和特性。网络测量实验2指的是该实验是系列实验中的第二个环节，可能包含对特定网络...
实验2：综合实验之Python编程.pptx
2024-04-16 16:07

本任务需要利用Python编程语言中的pandas库来完成数据的读写操作，并通过数据计算出总成绩最高的学生名字。具体步骤包括创建DataFrame存储学生成绩数据，将数据保存到Excel文件中，然后再次读取这个文件，找出总成绩...
实验二的2.代码及生成文件和实验报告
2022-06-26 22:43

从提供的文件列表来看，我们可以推测这是一个关于编程和数据分析的实验，特别是使用Python语言进行的。 `exp2_2.csv`、`exp2_3.csv` 和 `exp2_1.csv` 这些文件是CSV（Comma Separated Values）格式的数据文件，广泛...
心理学线上实验平台编程程序
2024-04-22 18:07

对于初学者，理解并运用这些编程程序可能会有一定难度，但通过阅读代码、调试和修改，可以加深对心理学实验设计的理解，提高编程技能。对于资深研究者，这些现成的程序可以作为参考，或者直接用于新实验的设计中，...
决策树实验报告代码大全
2022-10-18 17:06

- 使用Python编程语言，可以利用numpy库处理数值计算，pandas库处理数据集，sklearn库实现决策树算法。 - 决策树的实现通常包括数据预处理、计算信息熵和信息增益、选择最佳属性、构建树节点、递归地分割数据等...
python+numpy+matplotlib+pandas的使用：.ipynb代码
2024-03-02 08:04

Python是一种广泛应用于数据分析、机器学习和科学计算的高级编程语言，而numpy、matplotlib和pandas是Python中的三个核心库，分别用于数值计算、数据可视化和数据处理。 **Numpy（Numerical Python）**： Numpy是...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月4日

实验七：Pandas要有实验截图和代码

12条回答 默认 最新

问题事件

12条回答默认最新