普通网友 2025-08-14 10:10 采纳率: 97.8%

已采纳

如何正确使用scipy.stats.spearmanr计算Python中的斯皮尔曼相关系数？

**如何正确使用`scipy.stats.spearmanr`计算Python中的斯皮尔曼相关系数？** 在数据分析中，斯皮尔曼相关系数用于衡量两个变量之间的单调关系强度与方向。在Python中，`scipy.stats.spearmanr`是常用的计算该系数的方法。然而，许多用户在使用过程中容易忽略输入数据的格式要求，导致结果错误。例如，输入数据应为一维或二维数组，且缺失值需提前处理。此外，返回值中包含相关系数和p值，需正确解析。本文将详细介绍`scipy.stats.spearmanr`的使用方法，帮助开发者避免常见错误，确保统计分析的准确性。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

IT小魔王 2025-08-14 10:10

关注

如何正确使用 `scipy.stats.spearmanr` 计算 Python 中的斯皮尔曼相关系数？

在数据分析和统计建模中，斯皮尔曼相关系数（Spearman's rank correlation coefficient）是一种非参数统计方法，用于衡量两个变量之间的单调关系。与皮尔逊相关系数不同，斯皮尔曼相关系数基于变量的秩次（rank）进行计算，因此对数据的分布形态要求较低，适用于非线性或非正态分布的数据。

在 Python 中，scipy.stats.spearmanr 是常用的实现方式。然而，许多开发者在使用过程中因忽视输入格式、缺失值处理、返回值解析等问题导致结果错误。本文将从浅入深、由表及里地解析如何正确使用该函数。

1. 基本使用方法

scipy.stats.spearmanr 函数的基本语法如下：


import scipy.stats as stats

# 示例数据
x = [1, 2, 3, 4, 5]
y = [5, 6, 7, 8, 9]

# 计算斯皮尔曼相关系数
corr, p_value = stats.spearmanr(x, y)

print("Spearman correlation coefficient:", corr)
print("p-value:", p_value)

该函数返回两个值：

corr：斯皮尔曼相关系数，取值范围为 [-1, 1]，其中 1 表示完全正相关，-1 表示完全负相关，0 表示无单调关系。
p_value：假设检验的 p 值，用于判断相关性是否显著。

2. 输入格式要求

该函数支持一维或二维数组作为输入。如果输入是二维数组，则每一列代表一个变量，每行代表一个观测值。


import numpy as np

# 二维数组示例
data = np.array([
    [1, 2, 3],
    [5, 6, 7]
])

# 计算每列之间的相关性
corr_matrix, p_values = stats.spearmanr(data)

print("Correlation matrix:\n", corr_matrix)

输出将是一个相关系数矩阵，其中 corr_matrix[i][j] 表示第 i 列与第 j 列之间的斯皮尔曼相关系数。

3. 缺失值处理

如果数据中存在缺失值（NaN），则必须在调用 spearmanr 之前进行处理。该函数不支持自动跳过 NaN 值。


x = [1, 2, np.nan, 4, 5]
y = [5, 6, 7, np.nan, 9]

# 方法一：删除包含 NaN 的行
from scipy.stats import spearmanr

mask = ~np.isnan(x) & ~np.isnan(y)
x_clean = np.array(x)[mask]
y_clean = np.array(y)[mask]

corr, p_value = spearmanr(x_clean, y_clean)
print("Cleaned correlation:", corr)

另一种方式是使用 pandas 预处理数据，再传入 spearmanr。

4. 多变量相关性分析流程图

以下是一个使用 spearmanr 进行多变量相关性分析的流程图：

graph TD A[准备数据] --> B{是否存在缺失值?} B -->|是| C[处理缺失值] C --> D[调用 spearmanr 函数] B -->|否| D D --> E[获取相关系数矩阵] E --> F[解析结果并可视化]

5. 常见错误与解决方案

错误类型	原因	解决方案
ValueError: object too deep for desired array	输入数据维度过高	确保输入为一维或二维数组
NaN encountered in correlation	数据中存在缺失值	提前清理 NaN 值或使用 dropna
Unexpected correlation value	数据未标准化或存在异常值	检查数据分布，考虑数据变换或剔除异常值

6. 进阶技巧与注意事项

对于高维数据集，可以使用 pandas.DataFrame.corr(method='spearman') 方法进行批量相关性分析：


import pandas as pd

df = pd.DataFrame({
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [2, 4, 6, 8, 10]
})

# 使用 pandas 内置方法计算
spearman_corr = df.corr(method='spearman')
print(spearman_corr)

该方法返回的是一个 DataFrame 形式的相关系数矩阵，便于进一步可视化或分析。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

python计算spearman_python scipy: scipy.stats.spearmanr 返回 nan_python_酷徒编程知识库
2021-01-13 09:25

吉吉过六级的博客我正在使用scipy stats中的spearmanr来查找许多不同样本中变量之间的相关性。大约有2500个变量和36个样本(或观测值)如果我使用全部36个样本计算相关性，则spearmanr效果很好，如果我仅使用前18个样本，它也可以正常...
斯皮尔曼相关系数的python代码
2022-05-01 18:03

在Python中，我们可以利用`scipy`库中的`spearmanr`函数来计算斯皮尔曼相关系数。首先，我们需要了解斯皮尔曼相关系数的基本概念。假设我们有两个变量X和Y，它们的观测值分别被排序为秩R_X和R_Y。斯皮尔曼相关系数...
实现斯皮尔曼相关系数的Python代码示例
2025-07-06 09:35

不吃香菜的鱼的博客 斯皮尔曼相关系数（Spearman’s rank correlation coefficient），通常记为ρ，是...模块中的spearmanr函数是计算两个变量的斯皮尔曼等级相关系数（Spearman’s rank correlation coefficient）和相关系数的p值的工具。
统计建模与scipy.stats模块全解析：从概率分布到假设检验（六）
2025-04-12 01:55

WHCIS的博客 Python的SciPy库提供了丰富的统计功能，其中scipy.stats模块是进行统计计算的核心组件。本篇文章将系统阐释连续/离散概率分布的构建方法，详解假设检验（t检验/卡方检验）的实现流程，解析统计量计算与分布拟合的API...
spearman相关性 - 斯皮尔曼秩相关系数
2025-06-10 09:40

liliangcsdn的博客 spearman相关性，核心是斯皮尔曼相关系数，是秩相关的一种非参数度量，考察的是两个随机变量之间的单调关系的强度，也就是说两者在变大或变小的趋势上多大程度能保持步调一致。简易计算公式取得是每对秩的差值平方，...
python 斯皮尔曼相关系数,在某些情况下，Scipy-Spearman相关系数为NaN
2021-04-26 19:53

华夏英灵的博客我在计算面试官的斯皮尔曼相关系数。它适用于面试官1。。。我不明白Scipy是如何打断面试官_2的，因为他们没有相关性/0/nan。在import pandas as pdfrom pandas import DataFrameimport scipy.statsdf = pd.DataFrame...
肯德尔（Kendall）相关系数概述及Python计算例
2022-09-19 18:07

笨牛慢耕的博客（比如说，小明在班级中的历史成绩排名为10，英语成绩排名为4，那么在这个班级的学生的历史成绩和英语成绩的斯皮尔曼相关分析中，小明的成绩的贡献就是(10-4=6) ）来进行相关关系的评估；当数据样本比较小，而且存在...
用Python实现斯皮尔曼等级相关性检验
2023-05-05 19:56

代码编织匠人的博客与皮尔逊相关系数（Pearson correlation coefficient）不同，斯皮尔曼等级相关性检验并不要求数据点满足正态分布假设，而是将每个数据点的原始值替换为其在数据集中的排序位置。...通过使用Python中的。
spearman-rank:斯皮尔曼等级相关系数在python中的实现
2021-05-30 10:16

在Python中实现斯皮尔曼等级相关系数，可以使用多种库，如`scipy.stats`、`pandas`或自定义函数。在给定的文件`spearman-rank.py`中，我们可能看到一个简单的自定义实现，这通常是为了教学或理解算法原理而创建的。 ...
斯皮尔曼相关(Spearman correlation)系数概述及其计算例
2021-11-19 17:24

笨牛慢耕的博客简要介绍了斯皮尔曼相关系数(Spearman correlation coefficient)的概念、计算公式，以及手动计算例、调用scipy函数、pandas函数计算的代码示例。。。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月14日