直线回归是用直线回归方程表示两个数量变量间依存关系的统计分析方法,属双变量分析的范畴.
1. 直线回归方程的求法
(1)回归方程的概念:
直线回归方程的一般形式是?(音y hat)=a+bx,其中x为
自变量,一般为资料中能精确测定和控制的量,Y为应变量,指在x规定范围内随机变化的量.a为
截距,是回归直线与纵轴的交点,b为斜率,意为x每改变一个单位时,?的变化量.
(2)直线回归方程的求法
确定直线回归方程利用的是
最小二乘法原理,基本步骤为:
1)先求 b,基本公式为b=lxy/lxx=SSxy/SSxx ,其中lxy为X,Y的离均差积和,lxx为X的离均差平方和;
2)再求a,根据回归方程 a等于Y的均值减去x均值与b乘积的差值.
(3)回归方程的图示:
根据回归方程,在坐标轴上任意取相距较远的两点,连接上述两点就可得到回归方程的图示.应注意的是,连出的回归直线不应超过x的实测值范围.
2. 回归关系的检验
回归关系的检验又称回归方程的检验,其目的是检验求得的回归方程在总体中是否成立,即是否样本代表的总体也有直线回归关系.方法有以下两种:
(1)方差分析
其基本思想是将总变异分解为SS回归和SS剩余,然后利用
F检验来判断回归方程是否成立.
(2)t检验
其基本思想是利用样本
回归系数b与总体均数回归系数?进行比较来判断回归方程是否成立,实际应用中因为回归系数b的检验过程较为复杂,而
相关系数r的检验过程简单并与之等价,故一般用相关系数r的检验来代替回归系数b的检验.
3. 直线回归方程的应用
(1)描述两变量之间的依存关系;
利用直线回归方程即可定量描述两个变量间依存的数量关系
(2)利用回归方程进行预测;
把预报因子(即自变量x)代入回归方程对预报量(即
因变量Y)进行估计,即可得到个体Y值的容许区间.
(3)利用回归方程进行统计控制
规定Y值的变化,通过控制x的范围来实现统计控制的目标.如已经得到了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度.
4. 应用直线回归的注意事项
(1)做
回归分析要有实际意义;
(2)回归分析前,最好先作出
散点图;
(3)回归直线不要外延.