因果推断
在现实世界中,我们经常需要确定一个事件是否是另一个事件的原因,而不仅仅是相关联。确定一个变量(原因)是否导致另一个变量(结果)的变化。
相关系数
相关系数是衡量两个变量之间线性相关程度的统计量。最常用的相关系数是皮尔逊相关系数(Pearson correlation coefficient),通常用字母 r 表示。皮尔逊相关系数的取值范围在 -1 到 +1 之间。
- r=+1 表示两个变量之间存在完全正相关关系,即一个变量增加,另一个变量也增加。
- r=−1 表示两个变量之间存在完全负相关关系,即一个变量增加,另一个变量减少。
- r=0 表示两个变量之间没有线性相关关系。
一元线性回归
用于分析一个自变量(解释变量)和一个因变量(响应变量)之间的线性关系。
y=a+bx+e