关于积差相关(Pearson相关)的考试内容,主要涉及以下几个方面:
积差相关(Pearson相关)是衡量两个连续变量之间线性相关程度的统计方法,通过计算两变量协方差与各自标准差的乘积比来量化相关性。
数据要求
两变量为连续变量(如身高、体重等),且数据成对出现。
数据需满足正态分布,或接近正态分布(单峰对称)。
样本容量需≥30对数据。
线性关系
两变量间需呈线性关系,可通过散点图观察直线趋势。
独立性
每对观测值需相互独立,避免共线性影响。
积差相关系数(r)的计算公式为:
$$r = frac{sum (X_i - bar{X})(Y_i - bar{Y})}{sqrt{sum (X_i - bar{X})^2 sum (Y_i - bar{Y})^2}}$$
其中,$X_i$和$Y_i$为配对观测值,$bar{X}$和$bar{Y}$分别为两变量的均值。
分布假设
对数据分布要求严格,若数据偏态严重需改用非参数方法(如斯皮尔曼等级相关)。
共线性问题
当两变量受共同因素影响时,相关系数可能失真,需排除共同因素。
适用情况 :分析身高与体重、智力测验分数与学业成绩等线性关系。
非适用情况 :处理偏态数据(如考试成绩等级)或存在非线性关系的数据(如年龄与犯罪率)。
校正方法 :当样本量较小或存在严重偏态时,需采用校正的积差相关系数。
相关系数范围 :取值范围为-1到1,绝对值越接近1表示相关性越强。
注意 :实际应用中需结合数据特征选择合适方法,若条件不满足建议使用斯皮尔曼等级相关等非参数方法。