清华大学 经管院 李子奈 一元线性回归模型的参数估计

更新时间:2023-08-19 00:25:01 阅读量: 高中教育 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

§2.2 一元线性回归模型的参数估计 一、一元线性回归模型的基本假设 参数的普通最小二乘估计(OLS) 二、参数的普通最小二乘估计(OLS) 参数估计的最大或然法(ML) 三、参数估计的最大或然法(ML) 四、最小二乘估计量的性质 五、参数估计量的概率分布及随机干 扰项方差的估计

单方程计量经济学模型分为两大类: 线性模型和非线性模型 线性模型中,变量之间的关系呈线性关系 非线性模型中,变量之间的关系呈非线性关系 一元线性回归模型:只有一个解释变量 一元线性回归模型Yi = β 0 + β 1 X i + µ i

i=1,2,…,n

Y为被解释变量,X为解释变量,β0与β1为待估 待估 参数, µ为随机干扰项 参数 随机干扰项

回归分析的主要目的是要通过样本回归函 回归分析的主要目的 数(模型)SRF尽可能准确地估计总体回归函 数(模型)PRF。 估计方法有多种,其种最广泛使用的是普通 普通 估计方法 最小二乘法(ordinary least squares, OLS)。 最小二乘法 为保证参数估计量具有良好的性质, 为保证参数估计量具有良好的性质,通常对 模型提出若干基本假设。 模型提出若干基本假设。 注:实际这些假设与所采用的估计方法紧密 相关。

一、线性回归模型的基本假设假设1、解释变量X是确定性变量,不是随机变量; 假设2、随机误差项µ具有零均值、同方差和不序列相 关性: E(µi)=0 i=1,2, …,n Var (µi)=σµ2 i=1,2, …,n Cov(µi, µj)=0 i≠j i,j= 1,2, …,n 假设3、随机误差项µ与解释变量X之间不相关: Cov(Xi, µi)=0 i=1,2, …,n 假设4、µ服从零均值、同方差、零协方差的正态分布 i=1,2, …,n µi~N(0, σµ2 )

注意: 注意:1、如果假设1、2满足,则假设3也满足; 2、如果假设4满足,则假设2也满足。

以上假设也称为线性回归模型的经典假设 经典假设 或高斯(Gauss)假设 高斯( 高斯 )假设,满足该假设的线性回归 模型,也称为经典线性回归模型 经典线性回归模型(Classical 经典线性回归模型 Linear Regression Model, CLRM)。

另外,在进行模型回归时,还有两个暗含的 另外 假设: 假设5:随着样本容量的无限增加,解释变 量X的样本方差趋于一有限常数。即( X i X ) 2 / n →Q, ∑ n→∞

假设6:回归模型是正确设定的 6假设5旨在排除时间序列数据出现持续上升或下降的变 量作为解释变量,因为这类数据不仅使大样本统计推断变 得无效,而且往往产生所谓的伪回归问题 伪回归问题(spurious 伪回归问题 regression problem)。 假设6也被称为模型没有设定偏误 设定偏误(specification error) 设定偏误

二、参数的普通最小二乘估计(OLS) 参数的普通最小二乘估计(OLS)给定一组样本观测值

(Xi, Yi)(i=1,2,…n)要 求样本回归函数尽可能好地拟合这组值. 普通最小二乘法(Ordinary least squares, OLS) 普通最小二乘法 给出的判断标准是:二者之差的平方和 Q = ∑ (Yi Yi ) = ∑ (Yi ( β 0 + β 1 X i )) 22 1 1 n n

最小。

方程组(*)称为正规方程组(normal equations)。 正规方程组( 正规方程组 )

∑ xi2 = ∑ (X i X ) 2 = ∑ X i2

1 (∑ X i )2 n

∑ xi yi = ∑ ( X i X )(Yi Y ) = ∑ X iYi

1 ∑ X i ∑ Yi n

上述参数估计量可以写成: β = Σxi y i 1 2

Σx i β = Y β X 1 0

称为OLS估计量的离差形式(deviation form)。 离差形式( 离差形式 )。 由于参数的估计结果是通过最小二乘法得到的, 故称为普通最小二乘估计量(ordinary least 普通最小二乘估计量 普通最小二乘估计量( squares estimators)。 )

顺便指出 ,记 yi = Yi Y

则有

yi = ( β 0 + β1 X i ) ( β 0 + β1 X + e ) = β 1 ( X i X ) 1 ∑ ei n

可得

y i = β 1 xi

(**)

(**)式也称为样本回归函数 离差形式 样本回归函数的离差形式 样本回归函数 离差形式。 注意: 注意: 在计量经济学中,往往以小写字母表示对均值 的离差。

三、参数估计的最大或然法(ML) 参数估计的最大或然法最大或然法( 最大或然法(Maximum Likelihood,简称ML), 也称最大似然法 最大似然法,是不同于最小二乘法的另一种 最大似然法 参数估计方法,是从最大或然原理出发发展起来 的其它估计方法的基础。 基本原理: 基本原理 对于最大或然法 最大或然法,当从模型总体随机抽取n组 最大或然法 样本观测值后,最合理的参数估计量应该使得从 模型中抽取该n组样本观测值的概率最大。

在满足基本假设条件下,对一元线性回归模型:Yi = β 0 + β 1 X i + µ i

随机抽取n组样本观测值(Xi, Yi)(i=1,2,…n)。 假如模型的参数估计量已经求得,为 那么Yi服从如下的正态分布: Yi ~ N ( β 0 + β1 X i , σ 2 )

于是,Y的概率函数为P(Yi ) = 1 1 2σ2

(Yi β 0 β1 X i ) 2

σ 2π

e

(i=1,2,…n)

因为Yi是相互独立的,所以的所有样本观测值的联 合概率,也即或然函数(likelihood function) 或然函数(likelihood function)为: 或然函数 L( β 0 , β 1 , σ 2 ) = P(Y1 , Y2 , , Yn )= 1 (2π ) σ nn 2

1 2σ2

Σ (Yi β 0 β1 X i ) 2

e

将该或然函数极大化,即可求得到模型 参数的极大或然估计量。

由于或然函数的极大化与或然函数的对数的极 大化是等价的,所以,取对数或然函数如下:L* = ln( L) = n ln( 2π σ ) 1 2σ 2 Σ(Yi β 0 β 1 X i ) 2

解得模型的参数估计量为: ΣX i2

ΣYi ΣX i ΣYi X i β 0 = nΣX i2 (ΣX i ) 2 β 1 = nΣYi X i ΣYi ΣX i nΣX i2 (ΣX i ) 2

可见,在满足一系列基本假设的情况下, 模型结构参数的最大或然估计量 普通最小 最大或然估计量与普通最小 最大或然估计量 二乘估计量是相同的。 二乘估计量

可支配收入例2.2.1:在上述家庭可支配收入-消费支出 : 可支配收入 消费支出例中,对 于所抽出的一组样本数,参数估计的计算可通过下面的 表2.2.1进行。表 2.2.1 参数估计的计算表

Xi

Yi

xi

yi

xi y i

xi2

y i2

X i2

Yi 2

1 800 594 -1350 2 1100 638 -1050 3 1400 1122 -750 4 1700 1155 -450 5 2000 1408 -150 6 2300 1595 150 7 2600 1969 450 8 2900 2078 750 9 3200 2585 1050 10 3500 2530 1350 求和 21500 15674 平均 2150 1567

-973 1314090 1822500 947508 -929 975870 1102500 863784 -445 334050 562500 198381 -412 185580 202500 170074 -159 23910 22500 25408 28 4140 22500 762 402 180720 202500 161283 511 382950 562500 260712 1018 1068480 1102500 1035510 963 1299510 1822500 926599 5769300 7425000 4590020

640000 352836 1210000 407044 1960000 1258884 2890000 1334025 4000000 1982464 5290000 2544025 6760000 3876961 8410000 4318084 10240000 6682225 12250000 6400900 53650000 29157448

β1 =

∑x y ∑xi 2 i

i

5769300 = = 0.777 7425000

β 0 = Y β 0 X = 1567 0.777 × 2150 = 103.172

因此,由该样本估计的回归方程为:

Yi = 103.172 + 0.777 X i

四、最小二乘估计量的性质当模型参数估计出后,需考虑参数估计值的 精度,即是否能代表总体参数的真值,或者说需 考察参数估计量的统计性质。 一个用于考察总体的估计量,可从如下几个方 面考察其优劣性: (1)线性性 )线性性,即它是否是另一随机变量的线性 函数; (2)无偏性 )无偏性,即它的均值或期望值是否等于总 体的真实值; (3)有效性 )有效性,即它是否在所有线性无偏估计量 中具有最小方差。

这三个准则也称作估计量的小样本性质。 小样本性质。 小样本性质 拥有这类性质的估计量称为最佳线性无偏估计 最佳线性无偏估计 量(best liner unbiased estimator, BLUE)。 当不满足小样本性质时,需进一步考察估计量的 大样本或渐近性质: 大样本或渐近性质: 4) 渐近无偏性,即样本容量趋于无穷大时,是 ( 4 ) 渐近无偏性 否它的均值序列趋于总体真值; ( 5) 一致性 ) 一致性,即样本容量趋于无穷大时,它是否 依概率收敛于总体的真值; ( 6) 渐近有效性 ) 渐近有效性,即样本容量趋于无穷大时,是 否它在所有的一致估计量中具有最小的渐近方差。

高斯—马尔可夫定理 高斯 马尔可夫定理(Gauss-Markov theorem)在给定经典线性回归的假定下,最小二乘估计 量是具有最小方差的线性

无偏估计量。

2、无偏性,即估计量 β 0 、 β 1 的均值(期望)等于总体回归 无偏性,参数真值β0 与β1 证: β1 = ∑ k iYi = ∑ k i ( β 0 + β1 X i + µ i ) = β 0 ∑ k i + β1 ∑ k i X i + ∑ k i µ i

易知 故

∑x ∑k = x ∑i

i

2 i

=0

∑k Xi

i

=1

β1 = β1 + ∑ k i µ i

E ( β1 ) = E ( β1 + ∑ k i µ i ) = β1 + ∑ k i E (µ i ) = β1

同样地,容易得出 E ( β 0 ) = E ( β 0 + ∑ wi µ i ) = E ( β 0 ) + ∑ wi E ( µ i ) = β 0

本文来源:https://www.bwwdw.com/article/flgj.html

Top