• 扩展回归模型命令适用于
-线性模型
-具有区间截尾结果的线性模型,包括tobit模型
-probit模型
-有序Probit模型
• 可任意组合的
–内生协变量--连续的、二进制的或有序的
–样本选择
–非随机处理分配,包括外源性和内源性
– 面板数据
• 特定学科术语中的特性
– 由未测量的混杂引起的偏倚
– 信息缺失试验
– 平均因果效应(ACEs)
– 平均治疗效果(ATEs)
–线性模型中的同时因果关系
–非随机缺失结果(MNAR)
–不可忽略的无回应
–不可观测选项
–Heckman选择
–纵向数据
–二级数据
–随机效应
简单语法
ERMs的语法是一个命令,比如eregress,后面跟着主方程,然后是一个或多个选项如endogenous()、select()、entreat()或extreat()。这些选项可以任意组合指定,例如:
使用eregress和xteregress来拟合线性回归模型的相同语法也适用于eintreg和xteintreg来拟合区间回归模型,通过eprobit和xteprobit来拟合probit模型,通过eprobit和xteprobit来拟合有序probit模型。例如,
. eprobit y x1 , endogenous( x2 = x3 x4)
entreat( treated = x2 x2 x5)
select( selected = x2 x6)
拟合模型
我们可以通过输入以下命令来拟合毕业率模型:
. eprobit graduate income i.roommate,
entreat(program = i.campus income)
endogenous(hsgpa = income i.hscomp)
我们的主要方程将大学毕业(0/1变量graduate)建模为由父母收入(income)、学生是否有同为学生的室友((i.roommate)和高中GPA (hsgpa)决定。高中GPA是一个内生协变量,它本身是由父母收入决定的,也是一个衡量高中竞争力的有序变量(i.hscomp)。学校提供了一个自愿的新生计划,旨在提高毕业率(program),我们将其建模为由住校(i.campus)和父母收入决定的内生性处理。
探索结果
在拟合这个模型后,我们可以估计四个高中GPA组学生的毕业率。
我们可以看到,高中GPAs低于2.5的学生毕业率估计为11%,95%置信区间为8.6%至13.5%。而对于那些GPAs从3.5到4.0的学生,这一比例则上升到了99%。
我们甚至可以进一步探索毕业率与项目参与度、父母收入和高中GPA之间的关系。
. margins, over(program incomegrp hsgpagrp)
(output omitted)
. marginsplot
结果图表显示了参加该项目的学生(红色)和没有参加该项目的学生(蓝色)的预期毕业率。这四个小组是GPA组。每张图的x轴是父母的收入。
高级推断
• 推断统计
-预期方法
-预期概率
-预期均值和概率(也称为效应)的对比(差异)
-边际效应
-平均治疗效果(ATEs)
-被治疗者的平均治疗效果(ATETs)
-潜在结果方法(POMs)
-平均结构函数(ASF)的均值和效应
-平均结构概率(ASP)的均值和效应
• 统计量的估计可用于
-总人口
-亚种群
-特定协变量值的预期值
-经过审查和未经审查的结果
• 条件分析-指定所有协变量的值
•人口-平均分析-指定一些或没有协变量的值,超过剩余部分的平均值(边际)
• 推理类型
-针对零或任何其他值进行检验
-平等性检验
-对比
-成对比较
-每个统计量的置信区间
• 轮廓图
-任何推断统计
-任何关于亚群体或亚群体的统计数据(例如,年龄组或治疗水平)
-一个或多个协变量的多个固定水平的统计数据
-置信区间
北京天演融智软件有限公司(科学软件网)是Stata软件在中国的授权经销商,为中国的软件用户提供优质的软件销售和培训服务。
热门跟贴