条件概率分布
大写字母表示随机变了或者随机向量,小结字母代表随机变量的取值。
边缘概率分布为:
fX(x)=∫−∞∞f(x,y)dy
条件概率分布为:
fY∣X(y∣x)=fX(x)f(x,y)
它表示了Y是怎样取决于X的,换句话说,它表示用X对Y的预测能力。
条件均值:
E(Y∣x)=E(Y∣X=x)=∫yf(y∣x)dy
条件方差:
Var(Y∣x)=E{[Y−E(Y∣x)]2∣x}=E(Y2∣x)−[E(Y∣x)]2
条件分位数(Quantile):
FY(QY(α∣X)∣X=x))=αQY(α∣X)=FY−1(α∣X=x)
当α=0.5时,QY(0.5∣x)是中位数。
回归分析
E(Y∣X)表示Y对X的回归方程.
迭代期望定律:
E[E(U∣X)]=E(Y)EXE[G(X,Y)∣X]=E[G(X,Y)]
Tower Property:
E(Y∣X1)=E[E(Y∣X1,X2)∣X1]
条件均值
E(ε∣X)=0
意味着
E(ε)=0E(Xε)=0E(εh(X))=0Cov(X,ε)=0Cov(ε,h(X))=0
线性回归模型
E[Y∣X]=argmin(g∈F)E[Y−g(X)]2
其中F={g():RK→R∣∫g2(x)fX(x)dx<∞}
线性回归模型:
Y=X′β+u,β∈RK
经典线性回归
假设我们有一组的随机样本{Zt}t=1n,Zt=(Yt,Xt′)′,Yt是一个标量,Xt是一个(k+1)∗1维向量。
经典假设:
线性:Yt=Xt′β0+εt严格外生:E(εt∣X)=E(εt∣X1,...,Xn)=0非奇异:X′X=∑XtXt′非奇异,λmin(X′X)→∞球面误差方差:E(εt2∣X)=σ2,E(εtεs∣X)=0
定义均方误差(SSR):
SSR(β)=(Y−Xβ)′(Y−Xβ)=∑(Yt−Xt′β)2
那么普通最小二乘法的估计量为
β^=argminβSSR(β)
可以证明
β^=(X′X)−1X′Y=(n1∑Xt′Xt)−1n1∑Xt′YtX′e=0β^−β0=(X′X)−1X′ε
定义 P=X(X′X)−1X′,M=I−P,他们是对称(symmetric)且幂等(idempotent)的,而且
PX=X,MX=0
非中心化的R2:
Ruc=Y′YY^′Y^=1−Y′Ye′e
中心化R2(决定系数):
R2=1−∑(Yt−Y)2∑et2
调整的R2
R2=1−∑(Yt−Y)2/(n−1)∑et2/(n−K)
可以证明
R2=1−n−Kn−1(1−R2)
OLS估计量性质:
方差缩小:
Var(β^∣X)=σ2(X′X)−1
给定X,ε的分布:
f(ε∣X)=(2πσ2)n/21exp(−2σ2ε′ε)=f(ε)
F检验
β~是原假设H0成立时有约束模型的OLS估计量,即
β~=argmin(Y−Xβ)′(Y−Xβ)
这里约束条件为Rβ=r.首先构建拉格朗日函数
L(β,λ)=(Y−Xβ)′(Y−Xβ)+2λ′(r−Rβ)
其中λ是一个J*1的向量,称为拉格朗日乘子向量。拉格朗日函数的一阶条件为
−2X′(Y−Xβ~)−2R′λ~=0r−Rβ~=0
另一方面,无约束回归模型的OLS估计量是β^=(X′X)−1X′Y,结合上述第一个方程,可得
−(β^−β~)=
共有条评论 网友评论