文章插图
是总体回归係数,也是总体回归直线的斜率 。由式(2)不难理解,总体回归方程描述的是Y和X两个变数之间平均的数量变化关係 。在实际中,通常由于不可能把变数的全部可能取值收集齐全,总体回归方程中的参数
文章插图
是不可能直接观测计算而得的,是有待估计的未知参数 。为此,我们需要根据样本信息来估计 。若能通过适当的方法,找到两个样本统计量a、b分别作为参数
文章插图
的估计量,那幺用a、b分别替代总体回归方程中的参数
文章插图
,则得到估计的回归方程,也称样本回归方程 。一元线性的样本回归方程也称为样本回归直线,其形式如下:
文章插图
式中,
文章插图
是与自变数取值
文章插图
相对应的因变数均值
文章插图
的估计;a和b分别为总体回归方程参数
文章插图
的估计量,a是样本回归方程的常数项,也就是样本回归直线在Y轴上的截距,表示除自变数X以外的其他因素对因变数Y的平均影响量;b是样本回归係数,也即样本回归直线的斜率,表示自变数X每增加一个单位时因变数Y的平均增加量 。根据样本观察数据估计出a和b的数值之后,样本回归方程(3)可作为预测模型,即一元线性回归预测模型 。一元线性回归方程参数的估计最小平方法如何确定式(3)中的两个係数a和b呢?人们总是希望寻求一定的规则和方法,使得所估计的样本回归方程是总体回归方程的最理想的代表 。最理想的回归直线应该儘可能从整体来看最接近各实际观察点,即散点图中各点到回归直线的垂直距离,即因变数的实际值
文章插图
与相应的回归估计值
文章插图
的离差整体来说为最小 。由于离差有正有负,正负会相互抵消,通常採用观测值与对应估计值之间的离差平方总和来衡量全部数据总的离差大小 。因此,回归直线应满足的条件是:全部观测值与对应的回归估计值的离差平方的总和为最小,即:
文章插图
最小.
文章插图
根据式(4)的準则来估计回归方程係数a和b的方法称为最小平方法或最小二乘法 。显然,在给定了X和Y的样本观察值之后,离差平方总和的大小依赖于a和b的取值,客观上总有一对a和b的数值能够使离差平方总和达到最小 。利用微分法求函式极值的原理,即可得到满足式(4)的两个正规方程:
文章插图
解上述方程可以求得a和b 。通常将a和b的计算公式写为如下形式:
文章插图
套用实例【例1】为了研究某地区某行业企业广告支出对销售收入的影响,随机抽取了8个企业,调查得知它们的广告费与销售额的数据如表1的第(1)和(2)列所示,试建立企业广告费与销售额之间的回归方程 。