第03 讲 成对数据的统计分析
知识点一:变量的相关关系
(1)两个变量有关系,但又没有确切到可由其中一个去精确地决定另一个的程度,这种关系称
为相关关系.
(2)正相关、负相关
从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两
个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两
个变量负相关.
(3)线性相关、非线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这
两个变量线性相关.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或
曲线相关.
知识点二:样本相关系数
(1)相关系数 的计算
变量 与变量 的样本相关系数 的计算公式如下:
(2)相关系数 的性质
① 当 时,称成对样本数据正相关;当 时,称成对样本数据负相关.
当 时,成对样本数据间没有线性相关关系.
② 样本相关系数 的取值范围为 ,当 越接近 1时,成对样本数据的线性相关程度越
强;当 越接近 0时,成对样本数据的线性相关程度越弱.
知识点三:一元线性回归模型
(1)数学表述式:如果两个变量之间的关系可以表示为
我们称该式为 关于 的一元线性回归模型.
其中,称为因变量或响应变量,称为自变量或解释变量;和 为模型的未知参数,称为