社会流动效应及其拓展：方法发展、争论与评议|假定|异质性|拟合

王鹏

复旦大学

社会学系

博士后

社会流动效应及其拓展：方法发展、争论与评议

来源 | 《社会学研究》2024年第3期

作者 | 王鹏

责任编辑 | 刘保中

社会科学研究中常常面临地位不一致情况下的效应分解问题，其中社会流动效应的估计最为学界所关注。本文通过梳理社会流动效应测量方法的核心争论和最新进展，系统比较了不同方法在理论假设与模型设定等方面的差异，特别将广泛使用的对角线参照模型与新近提出的流动对照模型进行了比较。利用模型推导、模拟数据和现实数据分析，本文指出流动对照模型对传统方法的批评在理论和方法上都存在较大误区。基于此，本文提供了依据理论与现实情境选择适当方法的具体思路，并总结了方法应用过程中应当遵循的原则和需要注意的问题。

一、前言

个体的社会经济成就在多大程度上由其父辈的状况决定是衡量社会开放程度的重要指标。因而，社会流动研究一直是社会学领域的核心议题之一。社会流动的水平、模式与变化趋势之所以备受关注，还因为社会流动会作用于不同领域，并产生一系列的社会后果。

社会学家很早就开始讨论社会流动在个体和社会层面的影响（de Tocqueville，1835；Sorokin，1927，1959）。对个体而言，社会流动意味着个体的出身阶层与现时所在阶层存在差异，往往也意味着其自身占有的资源、交往的群体、接触的文化环境发生了改变，这些都可能影响到个体的行为模式、生活方式和价值观念等（Houle & Martin,2011;Wilson et al. ,2022）。社会流动对个体产生影响主要通过三种作用机制实现：一是阶层出身（流动起点）可以通过社会化过程将价值观念与行为倾向等内化为个体特征，或是通过代际联结影响当前的态度与行为选择（Kiley & Vaisey,2020）；二是现时所在阶层（流动终点）的资源或文化环境使个体改变了原有的态度与行为特征（Blau,1956）；三是社会流动过程本身可能会产生独立的影响，比如向上流动带来的满足感或向下流动的失落感等（Hope,1975）。在社会层面，一方面，受社会流动影响的个体态度和行为可以汇聚成群体性集合，成为超越个人层次的集体表征；另一方面，流动机会的结构性差异也会影响不同群体的社会态度，因而与群体间冲突、社会稳定和经济发展都存在密切的关系（Acemoglu et al. ,2018）。

然而，对于社会流动效应的研究，尤其是个体层面的研究长期受制于方法论上的困境，其测量方法也一直存在争议。社会流动产生的影响包括流动起点、流动终点与流动本身这三个方面的作用机制。但是，由于社会流动被定义为流动的起始位置和终点位置之间的差异，因此三者之间存在完全共线性的关系，在同一模型中无法同时识别（Hendrickx et al. ,1993）。事实上，不只局限于社会流动研究，只要涉及地位不一致效应的估计，就不可避免地面临模型识别的阻碍，如代际社会流动（代际向上流动或向下流动）、婚姻匹配（向上婚或向下婚）、主客观地位的不一致（地位高估或低估）、不同维度社会地位的差别（教育与收入不匹配），等等。如何从方法层面解决共线性问题，实现对地位差异效应的准确估计，成为摆在社会流动以及其他地位不一致研究面前的共同挑战。

自20世纪中叶以来，学者从研究的实际需要出发，针对这一问题提出了一系列解决方案。其中，对角线参照模型凭借较为合理的理论假定和简约有效的模型设定，在社会科学研究中得到广泛应用，甚至成为测量社会流动效应的“黄金标准”（Fosse & Pfeffer,2019）。值得注意的是，近年来国外社会学界再次兴起了对于流动效应估计方法的讨论（例如：Fosse & Pfeffer，2019；Luo，2022；Zang et al. ，2023）。部分学者对广泛使用的对角线参照模型提出了诸多批评，并引入了一些新的分析方法和策略。尤其是新兴的流动对照模型，对传统对角线参照模型参数估计的准确性以及理论假设的适用性进行了系统的批判（Luo,2022）。在此背景下，基于传统方法开展的研究，其结论是否可靠开始面临质疑和挑战。

改革开放以来，中国社会经历了急剧的社会转型，普遍性的向上社会流动成为社会变迁的重要主题（李路路、朱斌，2015；李路路等，2018；李培林，2021），社会流动的后果也引起学者越来越多的关注。近年来中国学者的相关研究，涉及社会流动对于个体的健康不平等与幸福感（王甫勤，2011；Zang & de Graaf,2016;Zhao et al. ,2017）、价值观念和社会态度（秦广强，2011；盛智明，2013；李路路等，2018；李姚军、王杰，2021；王鹏、干一卿，2022）、行为偏好与模式（石磊，2020；Fan & Yan,2019;Gan & Wang,2023）等诸多方面所产生的影响，并积累了较为丰富的研究成果。同时，对角线参照模型也是这类研究普遍采用的方法。尽管如此，对于测量流动效应的方法本身，国内研究却甚少反思和讨论。在学界兴起对传统方法的质疑之时，以中国为背景的社会流动效应研究以及其他相关的地位不一致研究应该如何选择合适的研究方法？传统对角线参照模型是否仍然适用于中国情境下的分析？这些问题都需要从方法论的角度予以解答。

鉴于此，本文梳理了相关方法的发展历程和核心争论，介绍了这一领域的最新进展，并通过严格的模型推导和模拟数据的检验将新兴方法与经典方法的差异与联系进行了比较分析。在此基础上，本文以中国情境下的主观幸福感和社会公平感研究为例，讨论了如何在具体的经验研究中进行方法选择和结果可靠性的检验，并据此为相关方法在社会科学领域的应用提出了系统化的建议，以避免研究者陷入方法使用不当的误区。

二、社会流动效应的测量

（一）方法发展脉络

为解决流动效应的参数识别问题，学者先后提出了几种不同的方案。20世纪60年代，邓肯（Otis Dudley Ducan）提出方形加法模型（Square Additive Model，SAM）。这一模型将地位不一致的影响定义为排除了两个地位变量的线性效应之外后的任何非线性效应，包括所有可能的流动起点与终点之间的交互项（Duncan,1966）。第二种方法是奥普（Keith Hope）提出的菱形加法模型（Diamond Additive Model,DAM）。这一方法通过将流动起点和终点结合，生成一个总体社会地位变量和一个地位不一致变量，并分别将其概念化为地位互补和地位替代的效应，进而得以分别确定两者的作用（Hope,1975）。

以上两种方法虽然能够在一定程度上解决模型识别的难题，但也或多或少存在一些缺陷。批评者认为，在方形加法模型中，地位维度的主效应仍然可能包含一些地位差异的效应，而且交互项也混淆了地位一致与不一致的共同影响，并不能真正反映社会流动的效应（Sobel,1981;Luo,2022）。另一方面，菱形加法模型被批评暗含了不同地位维度可以结合成一个整体性的地位测量的假设，并且该方法无法区分地位维度的主效应（Sobel,1981;Hendrickx et al. ,1993）。

对角线参照模型（Diagonal Reference Model，DRM）的出现很好地弥补了此前方法的不足。对角线参照模型也被称为对角线流动模型，最初由索贝尔（Michael E. Sobel）在研究社会流动与生育行为的关系时提出（Sobel,1981,1985）。该方法采用非线性设计，假设结果变量会受到流动起点和终点的共同影响，且两者影响力的权重之和等于1。为了测量相对权重，观察值按照流动起点阶层（行变量）和流动终点阶层（列变量）在列联表中进行交叉分类，对角线单元格表示未发生流动的群体，非对角线单元格表示发生流动的群体。该模型将未流动群体的估计值作为流动群体的主要参照。因此，每个非对角线单元格都有行维度和列维度两个参照。而起点阶层和终点阶层的相对重要性可以通过它们各自的权重来表示。基于这种思路，对角线参照模型的基础模型如下所示：

其中，Yij为结果变量，E(Yij)代表出身阶层为i、终点阶层为j的群体的期望值。g为连接函数，可以是线性或非线性的函数形式。μ为截距项。μii和μjj分别表示行效应和列效应，即未发生流动的阶层i和j所代表的该阶层平均效应。p和q则对应了出身阶层与终点阶层对个体影响的相对权重，具有重要的理论解释意义，权重的范围设定为［0,1］且p+q=1。βm代表去除出身阶层、终点阶层效应之后社会流动本身对个体的影响。M可以根据研究的需要划分不同的流动类型，如向上流动和向下流动、短距离流动和长距离流动等。在上述模型的基础上，研究者又提出了一系列的拓展模型，包括放松出身阶层和终点阶层影响权重不变的假设，令p和q或随阶层发生变化，或随社会流动类型发生变化，或随某一协变量发生变化，以及其他拓展形式（Zang et al.,2023）。

对角线参照模型由于其简单明确的模型设定，较好地解决了社会流动效应测量中的模型识别问题。同时，将非流动群体的结果视为阶层的主效应并作为流动群体的参照，也在理论层面具有较强的合理性。因此，这一方法在推出之后被学者广泛接受，并大量应用于有关阶层地位流动的后果、主客观地位不一致、婚姻匹配效应等研究中（如Chen，2018；Jin et al. ，2019；Wang & Olivos，2024）。

随着对角线参照模型近年来的应用越发广泛，部分学者开始从不同角度对这一方法提出了质疑（Fosse & Pfeffer,2019;Luo,2022;Zang et al. ,2023）。其中，罗丽莹2022年在《美国社会学评论》（American Sociological Review）杂志上发表的文章（Luo,2022）对对角线参照模型进行了较为系统的批评，不仅从理论与应用层面探讨了对角线参照模型的适用性和局限性，也提出了新的应对策略。罗文指出，对角线参照模型存在两个方面的重要缺陷：一是在发生大规模的社会流动时，非流动群体难以继续充当流动群体的参照；二是无法捕捉社会流动效应的内部异质性，即未能区分不同流动类型的具体效应。

（二）流动对照模型（MCM）的提出

针对对角线参照模型的不足，罗丽莹提出了一个测量异质性流动效应的新方法，称为“流动对照模型”（Mobility Contrast Model，MCM）。其模型设定与方形加法模型基本一致，且行列主效应的计算方法完全相同。但两者在测量社会流动本身的效应时存在差异。方形加法模型中的流动效应通过测量行列之间的交互效应得到，这会导致非流动群体也存在流动效应。因此，在流动对照模型中，社会流动效应被重新定义为去除行列主效应之后流动群体的行列交互项与非流动群体行列交互项之间的差值。流动对照模型的基础模型如下所示：

其中，αi和βj分别表示行效应与列效应。δij是出身阶层为i、终点阶层为j的群体观测值与行列效应之和的偏差，即排除了行列主效应之后的行列交互效应。在此基础上，其社会流动的单独效应被表示为δij-δii。

表1展示了对角线参照模型和流动对照模型的差异。可以看到，对角线参照模型消耗的自由度较少。在社会流动效应方面，对角线参照模型可以估计整体性流动类型的效应，如向上流动效应（m1）和向下流动效应（m2）两类；而流动对照模型则对每一个流动群体估计一个单独的社会流动效应。

同时，罗丽莹利用模拟数据和现实数据进行实证分析发现，当社会流动群体的规模越大时，对角线参照模型对数据的拟合效果越差，与流动对照模型在流动效应估计上的差异也越大，甚至出现了相反的结果。因此，罗丽莹认为，流动对照模型从两个方面实现了对传统对角线参照模型的拓展：一是它可以更灵活地估计和检测代际流动可能存在的异质性效应，即不同流动类型的群体，其流动效应也有所不同；二是流动对照模型对大规模社会流动的效应估计更具稳健性。因此，在流动规模较大，或是流动效应存在异质性的情况下，流动对照模型比对角线参照模型拟合优度更好，也更能捕捉流动的异质性效应。

三、是方法的改进还是比较的误区？

罗丽莹对对角线参照模型的批评为过往许多运用这一模型得到的研究结果打上了问号。考虑到中国社会在短期内发生了剧烈社会转型和大规模社会流动，对角线参照模型很可能并不适用中国社会流动效应的研究。然而，事实果真如此吗？接下来，本文将从理论与方法两个方面来判断流动对照模型与对角线参照模型之间是否存在如上所说的差异。

（一）理论层面比较

如何定义阶层主效应

两种方法从不同的理论视角出发，对阶层主效应做出了不同的定义。

对角线参照模型是以未发生流动的群体的特征代表该阶层的普遍状况。这一做法具有直观且深刻的社会学意涵。索罗金（Pitirim A. Sorokin）曾形象地指出：“如果我们想了解一个农民的特征态度，我们不会去找一个只当了几个月农民的人，而是去找一个一生都在从事农业的农民”（Sorokin,1959:509-510）。因此，当我们想把握某个阶层的属性特征，更好的做法是找一个天生就处于这一阶层、生长在这一阶层家庭的人。这些群体可以看作是这个阶层的核心，他们定义了该阶层的规范和价值观，而新加入者不一定会为这些价值观所同化（de Graaf et al. ,1995）。但对于那些经历过流动的人来说，他们的特征被流动起点或终点所“污染”，使得他们不适合代表某个特定阶层的属性特征（Hope,1975）。

当然，这一假设并非无可指摘。索贝尔就曾指出：如果在终点阶层中非流动群体的比例很小，这可能会减弱非流动群体的可见性，降低他们定义终点阶层所特有的社会文化规范的能力（Sobel,1981:904）。流动对照模型则是将出身为某一阶层的所有群体的均值作为该出身阶层的主效应，并用同样方式得到终点阶层的主效应。罗丽莹认为，地位的效应反映了个体所面临的独特社会规范和条件。一方面，出身同一阶层的群体在态度或行为养成的年龄阶段可能都面临类似的社会条件，而这些早期条件可能对个体的行为和福祉产生长期影响。因而在估计出身地位的影响时，应当合理地考虑该社会出身的所有个体，而不论其是否流动。同理，在估计终点阶层影响时，也应包括终点为同一阶层的所有非流动和流动个体。另一方面，当社会发生大规模的社会流动时，流动和非流动的群体可能会相互影响，仅仅以非流动群体作为参照就会变得不合时宜。

不过，罗丽莹给出的这两个理由同样值得商榷。就第一个理由而言，过往文献对于方形加法模型的批评同样适用于流动对照模型。举例来说，对于同样出身于阶层i的群体，流动至其他阶层的个体已经受到了流动过程以及终点阶层的影响，将其纳入起点效应的计算会混淆阶层主效应与社会流动效应。也就是说，流动对照模型隐含的假设是：经历了流动的那部分群体未受到流动效应的影响。而这个假设显然与它想测量社会流动效应的目的背道而驰，因此具有模型假设的内部矛盾性。第二个批评的理由也同样无力。什么样的流动规模足够影响未流动群体对于该阶层的代表性，并没有一个明确的标准。事实上，这不仅与流动规模相关，也与阶层结构化程度相关。一个社会的阶层结构化程度越高，意味着各个阶层的内核越稳定，阶层不流动群体的特征也越能代表这一阶层的一般状况。因此，判断哪种阶层效应的定义更加符合实际情况，需要结合现实情境进行审慎分析。

2.如何剥离社会流动效应

更进一步而言，对阶层主效应的不同定义会直接影响社会流动效应的界定。

在对角线参照模型中，基于以未流动群体为参照的理论假定，社会流动群体的特征可以看作受到出身阶层和终点阶层不同程度影响的结果，而在此之外的部分就是社会流动经历本身的影响，即社会流动的效应。这一效应可能随着流动类型的不同而变化。但是考虑到模型的简约性，研究者往往会假设某些流动类型的群体具有相同的社会流动效应。

流动对照模型对社会流动效应的估计就相对复杂。在计算出社会出身（行）和流动终点（列）的阶层主效应之后，模型需要计算流动表中每一个单元格的行列交互效应。在方形加法模型中，行列交互效应本身就被定义为社会流动效应，因为它代表了不能被出身和成就所解释的剩余部分。流动对照模型则认为，社会流动效应是流动经历带来的某些独特特征对结果产生的独特影响，这些影响不能归因于出身阶层和终点阶层的主效应，同时与未流动群体的特征也不相同。因此，需要将代表流动群体的非对角线单元格的行列交互效应（δij）减去代表同一社会出身的未流动群体的对角线单元格的行列交互效应（δii），得到的差值（δij-δii）才代表社会流动本身的效应。这也是模型名称中“对照”（contrast）一词的由来。

实际上，如果我们接受了流动对照模型对阶层主效应的定义，那么δij指的是流动群体不受出身和终点阶层影响的那部分变异，可以理解为社会流动的“收益”；δii则代表了未流动群体之于一般水平所发生的变异，我们可以将其理解为不流动的“守成”效应。在现实情境中，它可能源于社会比较所导致的态度和行为改变，可以视作一种未实现向上流动的“惩罚”。因此，δij-δii表示流动的“收益”与不流动的“惩罚”之间的差值。而在流动对照模型中，这一差值被重新定义为社会流动效应，并被罗丽莹视为对于方形加法模型最为关键的改进。

从以上的分析中可以看出，流动对照模型在某种程度上可以看作方形加法模型与对角线参照模型的结合：在阶层主效应的估计上采取了方形加法模型的做法，以行和列均值分别作为出身阶层和终点阶层的主效应；在社会流动效应的估计上则借鉴了对角线参照模型，将非流动群体作为参照对象。然而，也正因为如此，流动对照模型并未很好地回应学者在理论上对于前两类传统方法的批评：一方面，对阶层主效应的估计事实上混杂了社会流动本身的影响；另一方面，对社会流动效应的测量又与传统社会学意义上的定义有所差别。因此有必要进一步厘清其间的关系，以免产生概念上的混淆。

3.理论假设差异与模型不可比

综合上文分析不难发现，对角线参照模型与流动对照模型的设定隐含了不同的理论假设。问题在于，如果没有基于理论层面对社会流动效应的统一定义，模型之间的优劣对比就会成为“空中楼阁”。由于两个模型对行列效应与社会流动效应的定义存在差别，所以估计出来的参数差异并不能代表测量的精准度。因此它们测量的对象虽然都叫“流动效应”，但本质上不是同一种东西。衡量模型拟合优度的指标也会失去意义。既然如此，罗丽莹一文为什么可以利用模拟数据和现实数据，比较两个模型参数估计的准确性和模型拟合优度，并得出某些情况下流动对照模型优于对角线参照模型的结论呢？

（二）方法层面比较

流动对照模型与对角线参照模型的“等价性”

罗文之所以能够直接比较两个模型优劣，是因为其论证了流动对照模型与对角线参照模型在参数估计上存在某种程度的等价性。我们可以通过简单的推导重现这一论证过程。假设两个模型在估计时都达到了最佳的拟合优度，即完美拟合了现实数据。同时在对角线参照模型的设定中，假定每一个流动单元格都有单独的行权重和列权重，根据表1所示和亨德里克斯等人（Hendrickx et al. ,1993）的推导，可以得到。因此，在不考虑社会流动效应的情况下，任意一个单元格的期望值可以表示为：

这一结果恰好是方形加法模型和流动对照模型中的行效应（αi）和列效应（βj）之和。因此罗丽莹认为，尽管流动对照模型和对角线参照模型以不同的方式对阶层效应进行参数化，但不同的参数化只是描述阶层效应的不同方式，对角线参照模型和流动对照模型对于阶层效应的参数化在方法论上是等价的。

由此可以直接拓展到社会流动效应的估计。由于对角线参照模型与流动对照模型中的社会流动效应都是排除行列效应之后流动群体与非流动群体的差值，且前文已经证明两者的阶层效应等价，因此两个模型所估计的社会流动效应也可视作等价的。又因为对角线参照模型往往将流动类型简化为向上流动和向下流动，反映的是所有向上或向下流动群体的流动效应均值，所以罗丽莹将表1中两个模型估计的社会流动效应的关系表示为：

罗丽莹进一步指出，当向上流动或向下流动的群体内部具有同质性的流动效应时，对角线参照模型与流动对照模型所估计的社会流动效应就会完全相同。由于流动效应等价，两个模型也就有了比较参数估计准确性和模型拟合优度的基础。

2.流动对照模型与对角线参照模型的不可比

截然不同的模型理论假设却得到了等价的估计结果，这不得不让我们怀疑论证过程中可能存在某些问题。实际上，问题正出在社会流动效应本身。在论证两个模型的阶层效应等价时，罗丽莹假设了不存在社会流动效应。在得到阶层效应等价的结论之后，她又以此为基础论证其社会流动效应也应等价。然而，当存在社会流动效应时，两个模型的阶层效应可能已经不满足等价的条件了。对此，我们需要检验存在社会流动效应时模型的参数估计会产生怎样的变化。

如表2的情形一所示，令出身阶层和终点阶层均为高、中、低三类，结果变量为μij，行效应和列效应分别为Ri和Cj。先假设一个理想情况：简单形式的对角线参照模型和流动对照模型都能完全拟合观测值，且不存在社会流动的单独效应。参照罗文的做法，我们采用效应编码（effect coding，也叫ANOVA编码，即各行列的均值为0），令流动表的均值为0。此时不难得到：

接下来，我们按照传统社会流动效应的定义，假设存在向上流动和向下流动的效应，且流动效应的值分别为m1和m2。此时表2的情形一变为情形二。可以看到，加入向上流动和向下流动的效应之后，行效应、列效应和流动表均值都发生了变化。此时，由于对角线参照模型估计的条件并未改变，其估计的出身阶层权重依然为p，向上流动和向下流动的效应也分别为m1和m2。但对于流动对照模型而言，由于行列均值都发生了改变，我们需要进一步将流动表的均值控制为0，即所有单元格的值都减去（m1+m2）/3。由此我们得到新的流动表并计算出其新的行列效应，如表3所示。

在新的流动表中，αi和βj即为流动对照模型所估计的新的行效应和列效应。我们注意到，此时，

而此时对角线参照模型估计的p值没有发生改变，依然是R1/(R1+C1)。因此，只有当m1=m2时，才能满足p=α1/(α1+β1)。也就是说，只有向上流动与向下流动效应相等时，两个模型的阶层效应估计才是等价的。

接下来我们看流动对照模型对社会流动效应的估计。在表3行列效应的基础上，我们可以计算出流动表中各个单元格的行列交互效应δij，并进一步计算出流动对照模型所定义的社会流动效应δij-δii，结果展示在表3右侧。将表2与表3相比较，可以看出，当存在行列效应之外的向上流动与向下流动效应时，流动对照模型所估计的社会流动效应并不是我们预设的m1与m2，而是它们的线性组合。例如，出身阶层为高阶层，终点阶层为中阶层的群体，在对角线参照模型定义下的流动效应为m2，但在流动对照模型的定义下则是（m1+2m2）/3。

也就是说，只有当m1=m2时，两个模型所估计的社会流动效应才是等价的。而当向上流动与向下流动的效应不等时，两个模型所估计的流动效应也会存在差别。这就解释了前文提出的怀疑，即两个模型理论假设不同，参数估计的结果也并不等价。只有在一些特殊情况下，比如社会流动效应为0，或是向上流动与向下流动的效应相等时，两个模型参数估计的结果才恰好相同。

3.结果先行的模型拟合

既然模型本身并不可比，罗丽莹一文又是如何通过模拟数据和现实数据实现两个模型的比较呢？从模拟数据的生成过程来看，罗丽莹首先是根据流动对照模型对社会流动效应的定义生成了模拟数据，再在此数据的基础上分别用对角线参照模型和流动对照模型进行参数估计。从罗文中模型估计的结果来看，当数据设定的社会流动效应同质，即向上流动的效应与向下流动的效应相等时，两个模型估计的结果也近乎一致。而当流动效应不等时，两个模型估计的结果也大相径庭。其原因并非如罗文中所说的流动效应的异质性以及流动规模的变化，而是流动效应不等时两个模型在定义上的差异导致参数结果不同。至于模型拟合优度的差别也不是因为模型本身对于数据拟合能力有所差别，而是源于模型自由度的差异。这一点会在下文的分析中得到验证。

四、模拟数据分析与现实数据应用

为了检验本文对于不同方法的比较分析是否准确，本研究分别以模拟数据和现实数据为基础，考察不同方法在社会流动效应估计上的差异。

（一）模拟数据分析

生成模拟数据时，为简洁起见，我们直接选择了罗丽莹一文中所设定的社会整体流动率较高的情况，具体为出身阶层和终点阶层均为高、中、低三类，组成3×3的流动表；非流动与流动群体的样本量之比为6:4。与罗文中以流动对照模型的理论定义来设定社会流动效应不同，本文为了与之比较，选择以对角线参照模型的理论假定为基础来设定社会流动效应。当然，这一社会流动效应并非是绝对意义上的“正确答案”，而是作为模型比较的参照点。

本文设置了四类情境：（1）不存在单独的社会流动效应；（2）存在同质性的社会流动效应，效应值为0.3；（3）向上流动与向下流动的效应不同，分别为0.3和-0.2；（4）每一个流动单元格的流动效应都存在差异。表4展示了设定的四种情境下社会流动效应的值。此外，三类阶层的对角线效应分别设置为1,2,3；按对角线参照模型的设定，出身阶层的影响权重p设置为0.2，终点阶层的影响权重q则设置为0.8。每一流动单元格的标准差都设为0.2。

本文根据模型比较的需要，选择了对角线参照模型的四种形式，对应了四类社会流动效应情境的假定。例如，情境1的四个子模型分别为：不额外控制社会流动效应（M1-1）、控制是否发生社会流动（M1-2）、控制向上流动和向下流动（M1-3）、控制五类社会流动类型（M1-4），以此类推。模型估计采用非线性最小二乘估计（Sobel,1981），统计工具为Stata的drm命令以及R软件包gnm。流动对照模型方面，则利用罗丽莹所公开的Stata命令以及R软件包mcm进行估计。表5和表6分别展示了对角线参照模型与流动对照模型对模拟数据的估计情况。

表5中，我们首先通过比较拟合优度来确定每一种情境下对角线参照模型的最佳模型。比较AIC（Akaike Information Criterion，赤池信息准则）不难发现，四种情境中的最优模型（即AIC最小）分别为M1-1，M2-2，M3-3以及M4-4。这与我们对模拟数据的设定是一致的。这四个最优模型都准确估计出了传统定义下的对角线效应、出身阶层和终点阶层对结果的影响权重、流动类型的单独效应。也就是说，在对角线参照模型内部进行比较时，我们是能够通过拟合优度找到更加“正确”的模型的，这是因为同一方法对阶层主效应和流动的设定是一致的，不同模型之间只是参数多少以及估计值与真实数据拟合度之间的差异。

表6是流动对照模型的参数估计结果和拟合优度。由于流动对照模型是饱和估计模型（3×3流动表，9个参数），且模拟数据设定了固定的样本量和方差，因此四种情境下模型对数据的拟合优度都是一致的。不仅如此，流动对照模型的拟合优度与各情境下对角线参照模型的第四个子模型也完全相同。这是因为它们都用相同的参数个数实现了对流动表各单元格均值的完全拟合。这也意味着只要给对角线参照模型增加适当参数，它就可以与流动对照模型达到相同的拟合优度。但两者估计的参数值却存在很大差异，这与参数定义相关，而与模型优劣没有必然的关联。

关键在于两种方法所估计的参数值差异。我们能够看到，在情境1和情境2下，两种方法的估计结果高度一致。不论是阶层主效应还是社会流动的单独效应，两种方法都给出了近似的估计值，只是表达的方式有所差异。这也印证了本文第四部分模型比较的结论，即在流动效应为0（情境1）或同质（情境2）的情况下，对角线参照模型和流动对照模型在参数估计上是完全等价的。

但是当社会流动效应存在异质性时，两个模型的估计结果就开始存在差异了。如在情境3中，流动对照模型估计的值与对角线参数模型的估计值应满足表3所推导的关系。例如，出身阶层为高阶层，终点阶层为中阶层的群体，在对角线参照模型定义下的流动效应为m2，而在流动对照模型定义下则应该为。这一计算结果与表6情境3中估计的结果（-0.034）十分接近，验证了前文中关于两种方法关系的推导。

情境4中，对角线参照模型的估计值与模拟数据的“设定值”非常接近，而流动对照模型的结果则与“设定值”大相径庭。但是，这并不意味着流动对照模型的估计必然是“错误”的，只是表明在这种情境下，流动对照模型所估计的流动效应相对于传统定义下的流动效应出现了很大的偏离。而哪种定义更加符合实际情况，则取决于学者根据理论与现实所作的综合判断。

根据模拟数据的分析，罗丽莹提出的流动对照模型的两种适用情境，即社会流动的异质性和流动的规模并不必然成为方法选择的标准。其一，对角线参照模型同样可以通过增加或减少参数来测量流动的异质性，达到与流动对照模型相同甚至更佳的拟合效果；同理，流动对照模型也可以增加对参数的约束，达到与对角线参照模型类似的拟合效果。其二，流动的规模并不影响两种方法对结果的拟合，而只影响研究者对于不同方法理论假设是否合理的判断。

（二）现实数据应用

在明晰几种方法在理论假设与模型估计上的区别之后，一个重要的问题摆在研究者面前：在具体研究中我们应如何做出选择？接下来，本文将通过一组利用现实数据开展的实证研究来说明在具体研究中应如何根据理论和现实情况选择合适的方法，获得更加可靠的研究结论。

研究背景

我们选择了社会学领域长期关注的两个议题：主观幸福感和社会公平感。社会流动可能会对二者产生影响（李路路等，2018；Zang & de Graaf,2016；Zhao et al.,2017），具体作用机制如前言部分所述，在此不再赘述。而区分出身阶层、终点阶层和流动本身的效应，则是检验不同假设的关键。

2.数据与变量

本文选择的数据是“中国综合社会调查”（CGSS）数据。我们使用了CGSS2017、2018和2021年的合并数据，这三年的问卷在主模块部分都询问了关于主观幸福感和社会公平感的问题。为方便结果的呈现和解释，本文将这两个因变量作为连续变量处理，数值越高，则幸福感或公平感越强。就阶层而言，本文参考过往研究，并根据研究需要按照EGP阶层图式对阶层类别进行整合（Erikson et al.,1979），最终将出身阶层和终点阶层各分为四类，分别为高级非体力阶层、一般非体力阶层、体力阶层和农民阶层。

在控制变量方面，本文控制了包括年龄、性别、婚姻状况、健康状况在内的人口学变量，党员身份、工作单位、户口等社会经济变量以及其他相关变量。

3.模型结果

我们分别采用对角线参照模型、方形加法模型和流动对照模型估计社会流动对结果变量的影响。其中，对角线参照模型分别考虑四类子模型：不额外控制社会流动效应、控制是否发生社会流动、控制向上流动和向下流动、控制社会流动距离，再根据AIC比较模型优劣。方形加法模型和流动对照模型则会估计每一个单元格单独的社会流动效应。模型估计结果如表7和表8所示。

首先是主观幸福感的模型估计结果比较。对角线参数模型中，M1-2的AIC值更小，因此选为最终的模型。阶层主效应方面，从图1的A模块可以看出，三个模型所估计的阶层主效应呈现出高度一致的结果。在流动效应方面，对角线参照模型虽然得到了-0.023的流动效应，但并不显著。另外两个模型也没有得到显著的流动效应，尤其是流动对照模型，大部分单元格流动效应的估计值都接近于0。因此我们可以判断，社会流动经历本身对于主观幸福感并无十分显著的作用。同时，根据对角线参照模型的结果，终点阶层的作用要大于出身阶层的作用（相对权重为0.31 vs. 0.69）。这些结果与一些过往研究的结论一致（Zang & de Graaf,2016）。当然，就模型关系来说，也与前文的推论一致，即社会流动效应趋近于0时，对角线参照模型与流动对照模型的估计是等价的。

接下来是社会公平感的模型估计结果比较。对角线参照模型的M2-3拟合效果较好，因此作为选定的模型。在阶层主效应方面，由图1的B模块可以看出，对角线参照模型与另两个模型的估计结果出现了一定差异，尤其是在终点阶层效应方面。方形加法模型和流动对照模型估计的农民阶层的终点效应要明显低于对角线参照模型的估计。这一点不难理解。前两个模型在估计时计算的是所有终点为农民阶层的单元格的社会公平感均值。而从其他阶层向下流动到农民阶层的群体的社会公平感整体上比一直处于农民阶层的群体更低，因此用此方法估计出的终点效应也更低。而在对角线参照模型中，这些低于未流动农民的部分则会被归入向下流动的效应当中。实际上，改革开放后的中国，由非农阶层向下流动到农民阶层的群体数量相对很少（只占农民阶层总样本的10%不到），他们相对更低的公平感更可能是向下流动带来的心理后果，而不应被当作为终点效应的一部分，进而拉低对农民阶层本身公平感的估计。

类似的逻辑也能解释出身阶层效应的结果差异。由此，不同模型估计的流动效应也会产生较大区别。对角线参照模型估计出了向上流动对社会公平感有显著的正向作用，而向下流动则有负向作用（尽管并不显著）。方形加法模型和流动对照模型则出现了相对复杂的估计结果，两种流动方向均有正负不同的流动效应。尤其是农民向上流动，均出现了负向的社会流动效应。这是因为很大一部分社会流动效应在参数估计过程中已经被社会出身效应分摊掉了。

综合主观幸福感和社会公平感两个议题的考察，我们可以得到几点结论。首先，在检测不到社会流动效应的情况下，对角线参照模型和流动对照模型完全等价。此时研究者可以根据需要进行模型选择。前者可以估计出身阶层和终点阶层的相对权重并进行比较。后者则可以较直接地得到行列主效应。其次，在可以检测到社会流动效应时，就需要结合具体结果进行小心辨别。在社会公平感的研究中，我们发现，对角线参照模型的结果更加符合理论预期，也具有更加一致的现实解释力，因此我们倾向于相信对角线参照模型的结果。

（三）总结：方法的选择与评估

在上述分析的基础上，本文总结了社会流动或者地位差异效应的估计过程中进行方法选择的三个原则，即理论先行、情境分析和结果检验。

首先，理论先行，指的是选择方法之前需要预先有基本的理论分析和判断。本文认为，方形加法模型和对角线参照模型具有清晰的理论假设和概念定义，其优势和劣势同样也很明显。流动对照模型则试图调和二者，但在概念定义上存在模糊之处，理论假设也存在一定的内在矛盾性。学者在应用这三种方法之前，需要了解三种方法对于不同概念的定义方式和理论假设，并以此作为方法选择的前提。

其次，研究者需要根据研究对象的实际情况，判断不同方法的理论假设是否符合现实情境。例如，如果能接受未流动群体能够代表该阶层的一般状况这一假设，就可以采用对角线参照模型。如果认为测量阶层效应时必须将流动群体考虑在内，且不影响对社会流动效应的测量，则方形加法模型和流动对照模型都可以选择。在中国社会转型的背景下，阶层内部的构成发生了较大变动，以未流动群体代表某一阶层的假设受到挑战。这要求我们根据阶层结构化的特征以及研究问题的具体情况进行审慎分析。

最后，研究者需要根据模型估计的结果进行检验和判断。如果结果显示社会流动本身并不对结果变量有单独的效应，或是流动效应存在较强的同质性，则不同方法的选择对最终结果影响较小，此时可根据研究需要进行选择。而当流动效应存在较强异质性时，研究者需要从理论和经验层面对结果进行检验。如果某个模型的结果明显有违事实，且没有强有力理论支持，就需要怀疑是否由于所选择的模型不甚合理而得出了误导性的结论。

五、结论与讨论

社会流动效应是社会分层与流动研究的重要议题，其相关的拓展研究，即地位不一致情况下各类地位差异效应的分析也具有广泛的研究价值。本文通过梳理流动效应方法的发展历程，考察了不同方法的理论假设、模型设定以及两者相结合的情况，并利用数理推导和模拟数据分析，着重比较了对角线参照模型与流动对照模型之间的联系和差异。本文指出，流动对照模型所声称的相对于对角线参照模型的两点改进并不成立。首先，无论流动规模大小如何，两个模型在拟合优度上存在区别的主要原因是自由度的差别。当二者都设定为饱和模型时，拟合优度也会一致。其次，两个模型对于流动效应的定义存在根本上的区别，因此除了特定情况（流动效应为0或同质）之外，两个模型对于社会流动效应的估计都会产生差异。而何种估计更符合现实情况，则取决于具体社会情境下研究者对于阶层主效应和社会流动效应的定义。

总而言之，不同方法之间的最大差异在于其背后所暗含的理论假设不同，从而使其在不同的社会情境下解决理论关切的能力也有所不同。同时，由于完全共线性的存在，社会流动效应并不存在数学意义上的唯一解，必须在附加假设的基础上进行效应的分解，这也是此类定量研究方法面临的共同挑战（许琪等，2022）。因此，研究者需要警惕流动效应背后的理论不确定性，在现实情境基础上，结合有说服力的理论来选择合适的假定，否则很容易得出误导性的结论。

本文也存在一些局限。限于篇幅，本文未对不同模型适用的各类情况以及结果的稳健性检验进行更加细致的分析。此外，过往研究以及本文所举的实例多聚焦于绝对流动所产生的后果，但在社会激烈转型的过程中，相对流动——即排除了社会结构变化影响的地位变化的效应也具有重要的研究价值（Wei & Xie,2022;Hu,2022）。本文所讨论的传统阶层划分方法，同样也可以与新兴方法（如rank-rank方法）相结合，从而进一步探究相对意义上的社会流动效应。当然，引入一些新的测量维度，如个体对社会流动的主观感知，也可以在一定程度上跳脱共线性的限制，为估计社会流动的效应提供新的选择。另外，除了本文讨论的方法进展，学者也对传统模型进行了多方面的拓展，例如将对角线参照模型应用于连续变量、纵贯数据的分析（Billingsley et al. ,2018;Zang et al. ,2023），以适应不同研究目标的需要。在此未能一一详述。期待未来学者能够发展出更为优秀的测量社会流动效应的方法，以弥补现有方法的不足。