【相关系数r怎么求】在统计学中,相关系数(Pearson相关系数)是衡量两个变量之间线性关系强弱的一个重要指标。它可以帮助我们判断两个变量是否具有正相关、负相关或无明显相关性。本文将总结相关系数r的计算方法,并通过表格形式展示其步骤与公式。
一、相关系数r的定义
相关系数r(Pearson correlation coefficient)是一个介于-1和1之间的数值,用于描述两个变量之间的线性相关程度:
- r = 1:完全正相关
- r = -1:完全负相关
- r = 0:无线性相关
r值越接近±1,表示两个变量之间的线性关系越强;越接近0,则关系越弱或无关系。
二、相关系数r的计算公式
设变量X和Y有n对观测数据(x₁, y₁)、(x₂, y₂)、…、(xₙ, yₙ),则相关系数r的计算公式为:
$$
r = \frac{n\sum x_i y_i - \sum x_i \sum y_i}{\sqrt{[n\sum x_i^2 - (\sum x_i)^2][n\sum y_i^2 - (\sum y_i)^2]}}
$$
其中:
- n 是样本数量
- ∑x_i 是X变量的总和
- ∑y_i 是Y变量的总和
- ∑x_i y_i 是X和Y对应值乘积的总和
- ∑x_i² 和 ∑y_i² 分别是X和Y的平方和
三、相关系数r的计算步骤
| 步骤 | 内容说明 |
| 1 | 收集两组变量的数据(X和Y) |
| 2 | 计算X的总和(∑x_i)和Y的总和(∑y_i) |
| 3 | 计算X与Y的乘积之和(∑x_i y_i) |
| 4 | 计算X的平方和(∑x_i²)和Y的平方和(∑y_i²) |
| 5 | 将上述结果代入公式,计算分子和分母 |
| 6 | 求出r值,并解释其含义 |
四、示例计算(简化版)
假设我们有以下数据:
| X | Y |
| 1 | 2 |
| 2 | 4 |
| 3 | 6 |
| 4 | 8 |
根据公式计算:
- n = 4
- ∑x_i = 1 + 2 + 3 + 4 = 10
- ∑y_i = 2 + 4 + 6 + 8 = 20
- ∑x_i y_i = (1×2) + (2×4) + (3×6) + (4×8) = 2 + 8 + 18 + 32 = 60
- ∑x_i² = 1² + 2² + 3² + 4² = 1 + 4 + 9 + 16 = 30
- ∑y_i² = 2² + 4² + 6² + 8² = 4 + 16 + 36 + 64 = 120
代入公式:
$$
r = \frac{4×60 - 10×20}{\sqrt{[4×30 - 10^2][4×120 - 20^2]}} = \frac{240 - 200}{\sqrt{(120 - 100)(480 - 400)}} = \frac{40}{\sqrt{20×80}} = \frac{40}{\sqrt{1600}} = \frac{40}{40} = 1
$$
因此,r = 1,表示X和Y之间存在完全正相关关系。
五、注意事项
- 相关系数只能反映线性关系,不能说明因果关系。
- 数据应为连续变量,且呈正态分布时效果最佳。
- 若数据中存在异常值,可能会影响相关系数的准确性。
六、总结
| 项目 | 内容 |
| 相关系数r | 衡量两个变量之间线性相关程度的指标 |
| 范围 | -1 到 1 |
| 公式 | $ r = \frac{n\sum x_i y_i - \sum x_i \sum y_i}{\sqrt{[n\sum x_i^2 - (\sum x_i)^2][n\sum y_i^2 - (\sum y_i)^2]}} $ |
| 步骤 | 收集数据 → 计算各项总和 → 代入公式 → 解释结果 |
| 应用场景 | 用于分析两个变量之间的相关性,如收入与消费、温度与销量等 |
通过以上内容,你可以清楚地了解如何求解相关系数r,并将其应用于实际数据分析中。


