RStudio如何计算数据的中位数、均值和众数？

在使用RStudio进行数据描述性统计分析时，如何高效准确地计算数据集的中位数、均值和众数是初学者常见的技术问题。尽管R语言提供了内置函数如`mean()`和`median()`，但众数（mode）并未直接支持，需自定义函数实现。此外，在处理含有缺失值（NA）的数据时，是否正确设置`na.rm = TRUE`参数也常被忽视，导致计算结果出错。本文将演示如何在RStudio中完整实现这三个统计量的计算，并提供处理不同类型数据（如向量、数据框）的示例代码，帮助用户掌握基础但关键的数据分析技能。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
大乘虚怀苦 2025-07-30 04:00
关注
在RStudio中高效计算描述性统计量：均值、中位数与众数

1. 引言：描述性统计分析的重要性

描述性统计分析是数据分析的第一步，尤其在探索性数据分析（EDA）阶段，计算均值、中位数和众数能快速了解数据的集中趋势。R语言作为统计分析的主流语言之一，其基础函数提供了mean()和median()，但缺乏mode()函数，因此需要自定义实现。

2. 均值（Mean）的计算

均值是最常用的集中趋势度量，表示数据的平均值。R语言中使用mean()函数实现：

# 示例：计算向量的均值 data_vector <- c(2, 4, 6, 8, 10) mean_value <- mean(data_vector) print(mean_value)

处理含缺失值的数据时，应使用参数na.rm = TRUE以避免错误：

# 含NA值的向量 data_with_na <- c(2, 4, NA, 8, 10) mean_value <- mean(data_with_na, na.rm = TRUE) print(mean_value)

3. 中位数（Median）的计算

中位数是将数据排序后位于中间位置的值，适用于非正态分布数据。R语言使用median()函数计算：

# 示例：计算向量的中位数 median_value <- median(data_vector) print(median_value)

同样地，处理含NA值时需设置na.rm = TRUE：

median_value <- median(data_with_na, na.rm = TRUE) print(median_value)

4. 众数（Mode）的实现

R语言未提供内置函数计算众数，需自定义函数实现。以下是一个通用的众数计算函数：

mode_value <- function(x) { ux <- unique(x) ux[which.max(tabulate(match(x, ux)))] } # 示例：计算众数 data_vector_mode <- c(1, 2, 2, 3, 3, 3, 4) print(mode_value(data_vector_mode))

处理包含NA值的向量时，需先去除NA：

data_with_na_mode <- c(1, 2, NA, 2, 3, 3, 3) clean_data <- na.omit(data_with_na_mode) print(mode_value(clean_data))

5. 多列数据（数据框）的批量统计

当面对数据框（data frame）时，可以使用apply函数批量计算每列的均值、中位数和众数：

# 创建示例数据框 df <- data.frame( col1 = c(1, 2, 3, 4, 5), col2 = c(10, 20, 30, 40, 50), col3 = c(5, 5, 5, 6, 7) ) # 计算每列的均值 mean_values <- apply(df, 2, mean, na.rm = TRUE) # 计算每列的中位数 median_values <- apply(df, 2, median, na.rm = TRUE) # 计算每列的众数（需自定义函数） mode_values <- apply(df, 2, function(x) { ux <- unique(na.omit(x)) ux[which.max(tabulate(match(x, ux)))] }) # 输出结果 print(mean_values) print(median_values) print(mode_values)

6. 总结性流程图

以下为描述性统计分析流程图：

```mermaid graph TD A[导入数据] --> B[检查缺失值] B --> C{是否含有NA?} C -->|是| D[处理NA] C -->|否| E[继续分析] D --> F[计算均值] E --> F F --> G[计算中位数] G --> H[计算众数] H --> I[输出结果] ```

7. 常见错误与建议

未处理缺失值（NA）导致计算结果为NA。
误将mode()当作R内置函数使用。
在非整数或字符型数据中计算众数，需注意数据类型。
未对数据进行类型检查，导致函数运行出错。

建议在编写代码时加入类型判断与异常处理机制，提高代码鲁棒性。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

R语言开发之平均值，中位数和众数了解下
2018-09-17 15:59

luyaran的博客 R中的统计分析通过使用...平均值是通过取数值的总和并除以数据序列中的值的数量来计算，函数mean()用于在R中计算平均值，语法如下： mean(x, trim = 0, na.rm = FALSE, ...) 参数描述如下： x - 是输入向量。 t...
rstudio中位数的公式_如何在R中找到中位数
2020-07-07 07:34

cunchi4221的博客 rstudio中位数的公式In this tutorial, let’s learn how we can find the median in R. Median is defined as the measurement of central tendency in the data. In simpler terms, you may call it the ‘middle...
R语言内置函数（Built-in Functions）:最大值最小值、均值、中位数、分位数、数据标准化、行均值、列均值、行中位数、列中位数、中位绝对偏差、标准差、滞后差值、迭代差值等
2022-03-02 07:10

statistics.insight的博客 R语言内置函数（Built-in Functions）:最大值最小值、均值、中位数、分位数、数据标准化、行均值、列均值、行中位数、列中位数、中位绝对偏差、标准差、滞后差值、迭代差值等
缺失值填补的中位数填补法
2024-11-14 11:34

MD Analysis的博客 中位数填补（Median Imputation）是一种处理数据缺失的方法，通过用数据集中某个变量的中位数来替代缺失值。中位数填补特别适用于数据存在极端值或偏态分布的情况，因为中位数不受异常值的影响，能够提供一个相对...
中位数填补是一种处理数据缺失的方法
2026-03-26 10:44

MD Analysis的博客 中位数填补（Median Imputation）是一种处理数据缺失的方法，通过用数据集中某个变量的中位数来替代缺失值。中位数填补特别适用于数据存在极端值或偏态分布的情况，因为中位数不受异常值的影响，能够提供一个相对...
R语言与数据模型(1)-平均,方差,中位数，分位数，极差
2018-07-05 17:38

麦好的博客 xm[1] NA#na.rm表示允许缺失数据NA> xm<-mean(x,na.rm=TRUE)> xm[1] 30.14286>> x<-c(1,10,20,30,40,50,60)> xm<-mean(x)> xm[1]
众数（mode）是指在一组数据中出现频率最高的值
2025-06-21 10:49

MD Analysis的博客定量数据的集中趋势通常用平均数（average）、中位数（median）和众数（mode）来描述。它们能够帮助研究人员理解数据的中心位置，或者说数据分布的核心特征。
2篇3章1节：定量数据的集中趋势描述，文末有众数的自定义函数
2024-08-19 09:49

MD Analysis的博客统计描述主要通过统计指标和统计图表来描述数据的分布规律及其数量特征，从而为后续的统计推断提供基础。统计描述不仅在医学科研中应用广泛，在其他诸如经济学、社会学、工程学等领域也有着重要的作用。
【R语言数据分析】数据类型与数据结构
2024-05-01 21:20

米糕.的博客没有的返回FALSE，由于在R语言中T和F代表1和0，因此通过把基于grepl函数的结果借助as.numeric函数转换成数值型之后，可以在原有数据框添只有1,0的列，当然不转换成数值型也可以，那就添加的是T和F的列。类型全都修改...
基于模型的统计分析：R语言中的对比、均值及风险比应用
2025-05-11 13:01

黄涵奕的博客统计模型是数据科学和统计分析中的核心概念，它提供了一种通过数据来理解现象和预测未来的方法。统计模型通常由一系列数学公式组成，这些公式能够描述变量之间的关系。在应用上，统计模型能帮助我们从大量数据中提取...
R语言|数据预处理方法
2022-12-20 16:11

匠程的博客 R语言，数据预处理方法
Curso-EstadisticaDescriptiva-Rstudio-Python:Curs completo deEstadísticadescriptiva-RStudio和Python
2021-03-13 19:12

2. **基本统计量**：介绍均值、中位数、众数、四分位数、标准差、方差等衡量数据集中心趋势和离散程度的指标。 3. **频率分布与直方图**：通过R的`hist()`函数或Python的`matplotlib.pyplot.hist()`绘制数据分布，...
r语言dmy()函数转化出现na_R语言学习笔记（三）：基本的统计学数字运算（平均数、众数、中位数、方差等）...
2020-11-21 10:17

weixin_39790102的博客 中位数计算3.众数计算（pretty R包，大写）4.最大值最小值5.summary6.标准差7.方差大家好我们又见面了，今天也是开心的学习R语言的一天。小时候上学的时候每天都在吐槽，这对什么平均数、中位数、众数...
前后数据的直接对比和前后数据的统计对比
2024-11-15 17:41

MD Analysis的博客你可以逐行比较原始数据集和填补后的数据集，尤其是那些原始数据中包含缺失值的位置。这可以帮助你确认填补是否合理。
R语言——（四）、数据读入与预处理
2022-06-30 15:44

小趴菜_的博客数据读入方式：直接输入、外部数据读入c()函数方式输入 scan()函数输入数据先安装scan包 2.读R包中的数据 2.1查看当前环境下的数据：ls()函数 2.2删除数据: rm()函数 2.3查看所有预先提供的数据：data() 2.4查看...
R的数据预处理之数据清洗和数据变换
2025-05-07 09:52

MD Analysis的博客通过数据清洗、数据集成、数据变换和数据规约等步骤，可以显著提高数据质量，为后续的分析和建模提供坚实基础。在实际应用中，结合具体数据的特点和分析目标，选择合适的数据预处理方法，可以有效提升模型的准确性和...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月30日

RStudio如何计算数据的中位数、均值和众数？

1条回答 默认 最新

在RStudio中高效计算描述性统计量：均值、中位数与众数

1. 引言：描述性统计分析的重要性

2. 均值（Mean）的计算

3. 中位数（Median）的计算

4. 众数（Mode）的实现

5. 多列数据（数据框）的批量统计

6. 总结性流程图

7. 常见错误与建议

问题事件

1条回答默认最新