打开网易新闻 查看精彩图片

• 扩展回归模型命令适用于

-线性模型

-具有区间截尾结果的线性模型,包括tobit模型

-probit模型

-有序Probit模型

• 可任意组合的

–内生协变量--连续的、二进制的或有序的

–样本选择

–非随机处理分配,包括外源性和内源性

– 面板数据

• 特定学科术语中的特性

– 由未测量的混杂引起的偏倚

– 信息缺失试验

– 平均因果效应(ACEs)

– 平均治疗效果(ATEs)

–线性模型中的同时因果关系

–非随机缺失结果(MNAR)

–不可忽略的无回应

–不可观测选项

–Heckman选择

–纵向数据

–二级数据

–随机效应

简单语法

ERMs的语法是一个命令,比如eregress,后面跟着主方程,然后是一个或多个选项如endogenous()、select()、entreat()或extreat()。这些选项可以任意组合指定,例如:

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

使用eregress和xteregress来拟合线性回归模型的相同语法也适用于eintreg和xteintreg来拟合区间回归模型,通过eprobit和xteprobit来拟合probit模型,通过eprobit和xteprobit来拟合有序probit模型。例如,

. eprobit y x1 , endogenous( x2 = x3 x4)

entreat( treated = x2 x2 x5)

select( selected = x2 x6)

拟合模型

我们可以通过输入以下命令来拟合毕业率模型:

. eprobit graduate income i.roommate,

entreat(program = i.campus income)

endogenous(hsgpa = income i.hscomp)

我们的主要方程将大学毕业(0/1变量graduate)建模为由父母收入(income)、学生是否有同为学生的室友((i.roommate)和高中GPA (hsgpa)决定。高中GPA是一个内生协变量,它本身是由父母收入决定的,也是一个衡量高中竞争力的有序变量(i.hscomp)。学校提供了一个自愿的新生计划,旨在提高毕业率(program),我们将其建模为由住校(i.campus)和父母收入决定的内生性处理。

探索结果

在拟合这个模型后,我们可以估计四个高中GPA组学生的毕业率。

打开网易新闻 查看精彩图片

我们可以看到,高中GPAs低于2.5的学生毕业率估计为11%,95%置信区间为8.6%至13.5%。而对于那些GPAs从3.5到4.0的学生,这一比例则上升到了99%。

我们甚至可以进一步探索毕业率与项目参与度、父母收入和高中GPA之间的关系。

. margins, over(program incomegrp hsgpagrp)

(output omitted)

. marginsplot

结果图表显示了参加该项目的学生(红色)和没有参加该项目的学生(蓝色)的预期毕业率。这四个小组是GPA组。每张图的x轴是父母的收入。

打开网易新闻 查看精彩图片

高级推断

• 推断统计

-预期方法

-预期概率

-预期均值和概率(也称为效应)的对比(差异)

-边际效应

-平均治疗效果(ATEs)

-被治疗者的平均治疗效果(ATETs)

-潜在结果方法(POMs)

-平均结构函数(ASF)的均值和效应

-平均结构概率(ASP)的均值和效应

• 统计量的估计可用于

-总人口

-亚种群

-特定协变量值的预期值

-经过审查和未经审查的结果

• 条件分析-指定所有协变量的值

•人口-平均分析-指定一些或没有协变量的值,超过剩余部分的平均值(边际)

• 推理类型

-针对零或任何其他值进行检验

-平等性检验

-对比

-成对比较

-每个统计量的置信区间

• 轮廓图

-任何推断统计

-任何关于亚群体或亚群体的统计数据(例如,年龄组或治疗水平)

-一个或多个协变量的多个固定水平的统计数据

-置信区间

北京天演融智软件有限公司(科学软件网)是Stata软件在中国的授权经销商,为中国的软件用户提供优质的软件销售和培训服务。