研究述评|毕向阳：基于多水平验证性因子分析的城市社区社会资本测量——实例研究及相关方法综述|163

毕向阳，中央民族大学民族学与社会学学院

摘要

对于作为集合性概念的社区社会资本，以往研究通行的做法是对采自个体的数据以社区为单位取均值作为相应高水平构念，再进行因子分析。然而，由于缺乏必要的评估，这种聚合处理存在信效度问题。在对以往有关研究进行总结和反思的基础之上，立足于某大型城市社区调查数据，本文检验了社区社会资本相关题项的ICCs、Rwg等指标，发现总体来讲各指标组内一致性和信度较低。结合相关方法的进展，本文建议（认知性）社区社会资本构建应置于多水平潜变量模型的框架之下，并使用多水平验证性因子分析进行建模。最后，文章对相关发现的理论意义和方法存在的局限进行了简要探讨。

关键词

社区社会资本；聚合；多水平验证性因子分析；多水平潜协变量；双潜多水平模型

一、问题提出与研究现状

在社会理论的传统中，社会资本是从个体之间的关系或网络角度来界定的（Bourdieu,1983；Lin,2002）。科尔曼首先将之扩展到宏观领域，定义为社会结构的特征（Coleman,1990）。在此基础上，帕特南明确从集体层面（信任、规范和网络维度）来界定社会资本并运用到大规模治理研究中（Putnam et al.,1994）。自其《使民主运转起来》问世以来，集体性或生态性社会资本的概念进入多学科的视野。

开展集体性社会资本研究，前提是对这一构念进行精确界定和测量。从形式上看，除了经济学家偏爱的将单一指标（如网络密度、组织数量）作为代理变量的方式外，考虑到概念本身的复杂性，大部分研究都是多维度的综合测量。比如，帕特南主持的社会资本社区基准调查（SCCBS）问卷含有社会信任、志愿行为等11个维度（见Hudson & Chapman，2002）。世界银行开发了SCAT量表（Krishna & Shrader，1999），后来又推出SC-IQ问卷（Grootaert & Bastelaer，2001），含6大板块，95个题项。由于SCAT较长（超过60个题项且包括开放题），后续出现了简化版本A-SCAT（Harpham，2008）和SASCAT（De Silva,2005；De Silva et al.,2006），含结构和认知维度。

在当代中国，城市空间—社会结构正在经历深刻转变。学界对新建小区治理、业主维权、城市基层政权建设等现象给予了积极关注。在各类研究中，社区社会资本（以下简称CSC）是一个核心概念。尤其在社会建设或治理的话语下，城市的基层变迁被赋予了一个CSC培育的旨向（孙立平，2001；赵孟营、王思斌，2001）。与国外的相关研究相比，除了身心健康、居住满意度等经典主题（如余慧等，2008；刘志林等，2015），国内有关研究常以此来解释维权行动、社区参与等主题（如桂勇、黄荣贵，2008；黄荣贵、桂勇，2011；桂勇、于沁，2016），无疑与此背景密切相关。

在借鉴国外有关研究的基础上，国内学者结合本土经验，在CSC测量方面进行了富有成效的探索。赵延东（2006）最早利用西部大型调查数据从信任和参与维度对社会资本进行了测量。在对农村基层选举的研究中，胡荣（2006）基于帕特南的框架，构建了信任、交往、社区归属、社团等6个维度的CSC测量。桂勇、黄荣贵（2008）系统梳理了国外相关文献，基于经验数据创建了包含地方性社会网络、归属感、凝聚力、志愿主义、互惠和社区信任等7个维度的指标体系。项军（2011）提出的“社区性”量表包括社区认同感与归属感、互助、凝聚力、参与、信任等7个维度，实则也可看作CSC测量。方亚琴、夏建中（2014）在有关研究基础上构建了9个维度的CSC量表，经实际分析保留了社区感、互惠与支持、参与、关系网络等5个维度。罗家德、方震平（2014）基于汶川震后30个乡村社区调查数据，从关系、结构与认知三个维度界定并测量CSC，与纳哈皮特和戈沙尔（Nahapiet & Ghoshal,1998）的社会资本分类方式一致。

目前来看，较之个体性社会资本，由于集体性社会资本概念定义多元化、维度甚多，且涉及不同层面，如何界定和测量一直存在很大争议，正如有学者（如Baum & Ziersch,2003）指出的，社会资本测量问题本质上反映了概念本身的争论，相关研究也主要集中于概念界定、指标甄选等理论探讨环节，而在测量模型方面则缺乏必要的反思。帕特南传统的CSC典型属于集体性构念，但经验研究一般基于个体层面进行测量。正如德席尔瓦（De Silva,2005；De Silva et al.,2005）观察到的，测量的要么是个体获得生态资源的途径（比如个体通过参与卷入社区），要么是个体对生态资源的感知（比如个体是否认为人们普遍值得信任）。

早期相关研究往往忽略数据嵌套结构。赵延东（2006）的研究对象定位于“居民层面宏观社会资本”，因子分析建模在个体层面进行。一些研究（胡荣，2006；孙昕等，2007；刘志林等，2015）虽然将社会资本定义为集体构念，但回归模型中直接使用个体层面测量结果。这类处理方式属于聚解（disaggregation），虽不必考虑组内一致性问题，但方法上存在还原谬误问题，实际上分析的是夹杂了一定集体成分的个体（感知）的CSC。一般来讲，在多水平分析中，如果组内相关达到一定水平，忽略嵌套结构进行单水平因子分析，针对的是总体协方差矩阵（ΣT），其中混合了组间和组内不同水平的信息。由于组群内部的相似性，观测值独立性假设被破坏，会导致出现高估题项内部相关或协方差、因子载荷和标准误估计有偏、统计显著性检验失效等问题（Julian，2001；Dyer et al.,2005；Preacher et al.,2010）。

近来，国内外社区相关研究开始引入多水平回归模型（以下简称MLM）技术（如De Silva，2005；Wind & Komproe，2012；余慧等，2008；蔡禾、贺霞旭，2014；桂勇、于沁，2016），在CSC或相关指标测量上均以个体数据聚合（aggregation）为基础（如Putnam，2000；De Silva，2005；桂勇、黄荣贵，2008；黄荣贵、桂勇，2011；项军，2011；方亚琴、夏建中，2014；罗家德、方震平，2014）。相关综述研究（Agampodi et al.，2015）发现，多数研究均是从微观/个体层面收集数据，组群层面构念来自于对个体层面测量的聚合。

在多水平分析中，聚合是基于低水平测量构建高水平构念的基本方式。然而正如有学者（Dixon & Cunningham，2006）指出的，不能因为取均值方便就假定组均值是群体特征的合适估计。如果群体内部差异很大，取组均值的方式实际上会掩盖很多信息，最好的概念化和解释的层面是在个体而非群体层面。普雷彻等（Preacher et al.,2010）总结了多水平分析中聚合处理的一系列问题，其中包括：（1）组内单位变异信息被削弱，实际上相当于假定了被聚合变量组内变动性为零；（2）组群不论规模大小，在决定系数估计时被赋予了相等的权重；（3）聚合而来的变量不一定能很好地代表组群尺度的构念，等等。

因此，程序上多水平分析中在对低水平变量进行聚合之前需要检验组内一致性。在一致性较低的情况下聚合，通常意味着高水平构念缺乏构念效度（James，1982；Kozlowski & Klein，2000；Klein et al.，2001）和信度（Raudenbush et al.，1991；Snijders & Bosker，1999；Bliese，2000；Asparouhov & Muthén，2006；Lüdtke et al.，2008）。现在来看，虽然基于MLM的相关研究在建模之前一般都会对结果变量进行组内一致性检验，但大都忽视了对作为解释变量的CSC原始指标的相应处理（如余慧等，2008；桂勇、于沁，2016；Agampodi et al.,2015）。截至目前，相关研究中只有个别学者提及这个问题。弗里切等（Friche et al.,2013）在对邻里属性测量的应用中注意到，由于个体感知存在异质性，多个量表（邻里参与、邻里问题和内聚力）的ICC值（即组内相关）均处于较低水平。这种情况下，人们有理由怀疑简单聚合而成的高水平构念的信度和有效性。

然而问题在于，即使经过必要的计算，达到了可以聚合的临界条件，基于聚合方式的因子分析处理嵌套数据仍值得商榷。这一点可由多水平协方差结构分析说明。定义（加权）样本组间协方差矩阵（SB）（Muthén,1990,1994）如下：

从该式来看，SB由各组变量聚合均值（并中心化）而得，利用组均值的因子分析也正是基于加权或未加权的组均值样本协方差矩阵。然而，马森（Muthén,1990,1994）早已证明，SB并非总体组间协方差矩阵（ΣB）的无偏估计，实际上SB不仅是ΣB的函数，而且也是组群规模（c）及组内协方差矩阵（ΣW）的函数。即：

以SW表示样本组内协方差矩阵。因为有SW=ΣW，故据上式可推导出（Muthén,1990,1994）：

式（3）意味着，准确估计ΣB，需要从SB中去除SW成分并同时考虑c。尽管基于传统MLM方法，萨勃拉曼尼亚等（Subramanian et al.，2002；Subramanian et al.，2003）敏锐地发现，邻里层面社会资本评估一般都是基于个体对信任和互惠感知的聚合，而个体感知会受到个体特征的广泛影响，因此估计的情境性效应中可能掺杂着个体感知的构成性效应。

总之，采取“聚合+组群层面单水平因子分析”方式构建CSC，实际上是基于SB，其中混杂了个体异质性，而非“纯正”的社区层面构念。结果会低估组间结构，因子载荷会出现保守性偏误（Dyer et al.,2005）。本文从聚合前提条件的介绍和分析出发，通过引入多水平结构方程模型（以下简称MSEM）的最新进展，讨论CSC测量模型改进的可行方向。

二、方法综述

（一）高水平构念类型学及聚合可行性

在多水平分析中，低水平指标聚合的可行性建立在对高水平构念的类型学区分基础之上。

柯兹罗斯基和克莱因（Kozlowski & Klein,2000）将高水平构念区分为汇集型（compilation）和合成型（composition）。前者植根于不连续理论模型，仅存在于组群层面，在个体层面没有意义，例如性别比即是如此。后者植根于同构理论模型，来自于群体内部个体的响应，但其心理测量学属性只出现在组群层面的分析，聚合前需考虑组内一致性。波利斯（Bliese,2000）另提出现实中更常见的模糊（fuzzy）合成类型，属部分同构构念，高水平构念与对应低水平构念均有意义，二者相关但不同，其间差异很大程度上受ICC大小影响。

在操作上，柯兹罗斯基和克雷恩（Kozlowski & Klein，2000；Klein & Kozlowski，2000）进一步将群体层次构念属性分为全局性特征（global properties）、构造性特征（configural properties）和共享性特征（shared properties）三类。整体特性即客观存在的组群层面特性，存在于宏观层面，不依赖个体知觉、经验、行为或个体交互作用而存在，可直接测量，如社区位置。构造性特征源自个人层次，测量要求各组群样本有足够代表性，例如年龄结构，但研究者只是捕捉个体所属群体的构型或者序列，并不假定也不需要群体内部成员具有一致性。共享性特征来源于群体成员具有共同的经验、态度、价值观、认知以及行为，只有个体共享相似知觉时才存在，如群体凝聚力。后两类构念测量均需通过个体完成。

一些使用MLM的经验研究（Subramanian et al.，2002；Subramanian et al.，2003；Araya et al.，2006）结果表明，在控制了个体社会经济地位、人口特征等变量之后，认知性社会资本或特定维度仍存在显著社区间差异，间接支持社会资本概念属于情境性构念。不过从常见题项设计来看，即使只针对认知性维度，目前CSC量表（如桂勇、黄荣贵，2008；方亚琴、夏建中，2014）实际上也混合了不同类型的题项。按陈（Chan,1998）总结的类型学标准，比如“是否经常征求邻居的意见”属于可加构成模型，“在小区有家的感觉”属于直接共识构成模型。有些题项则典型属于参照转移模型，如“小区里大部分人愿意相互帮助”等题项。在可加构成模型中，聚合水平现象独立于个体感知而存在，感知一致性程度只是作为信度估计的指标，而非构念自身存在的指标（Hofmann,2002）。而对于共识模型（直接共识、转移参照模型）构念，具有典型的共享特征必须以较高的成员一致性为前提。个体之间的差异代表着个体独特感知，尽管在多数分析中不是研究者感兴趣的因素，却构成水平-2构念缺乏信度的根源（Marsh et al.,2012）。

所以，按惯例，在传统多水平分析中，低水平变量是否可聚合为高水平构念需要对组内一致性进行评价。常用评价指标包括组内相关（ICCs）和内部一致性系数（Rwg）。ICCs的主要功能在于显示总体变异多大程度上源于所属组群的特征［ICC(1)，即ICC］，以及这种特征能否产生稳定的组均值［ICC(2)］。Rwg指的是组内共识性程度，统计上定义为针对总体构念组群内个体回答测量题项的变异程度与个体属于随机或均匀分布下回答变异程度之比值。各组群都有自己的Rwg，如相差不大可用均值代表一般情况。要注意的是，Rwg只评估组内一致性而不考虑组间变化，因为很有可能存在各组内部成员都同意但组间没有差异的情况，所以该指标不涉及高水平构念效度问题（Chan,1998）。相比之下，ICCs由于包含组间方差信息，可作为高水平构念建构效度的测量（Chen et al.,2004）。ICC(2)则提供了判断突生性（emergent property）的证据（Bliese,1998，2000）。

（二）多水平潜协变量方法与双潜多水平模型

多水平分析中，在缺乏一致性的条件下进行聚合，信度会成问题，特别是各组观测数较少、ICC较小时，会导致估计偏差（Raudenbush et al.，1991；Snijders & Bosker，1999；Bliese，2000；Asparouhov & Muthén，2006；Lüdtke et al.，2008；Muthén & Asparouhov，2011）。这一点从相应的信度估计公式（Bliese,1998），即ICC(2)定义公式即可以看出。实际上，即便对于构造性构念，由于存在测量误差，均值也未必是合适的统计量（Bliese & Halverson，1996；Bliese,1998；Shin & Raudenbush，2010；Grilli & Rampichini，2011），聚合不仅导致情境效应估计有偏，而且会造成组间变量关系估计有偏。由于实际研究中ICC(2)极少达到1，所以通常会发生低估。柯克曼等（Kirkman et al.,2001）对比共识法和聚合法分析实际数据的结果，也发现聚合方式会产生保守估计。

然而，从潜变量模型角度来看，即便通过ICCs、Rwg等指标计算表明可进行聚合处理，由此生成的情境变量实际上假定了基于低水平变量聚合而得的高水平构念没有误差，但事实上聚合指标往往带有难以忽视的误差，真实值是不可观测或潜在的（Rabe-Hesketh et al.,2004）。聚合实际上是将观测的某个预测变量的组均值作为该变量在组群层面潜在特征的代理，这样做信度较差，会造成估计偏差（Lüdtke et al.,2008;Preacher et al.,2010;Marsh et al.,2012）。

那么，如何更有效地通过低水平测量建构高水平构念？MSEM提供了一个解决思路。MSEM是结构方程（以下简称SEM）与MLM的结合。这种结合既有主观需求，也有客观基础。实际上，MLM和SEM在数学和经验上等价，只需将分析单位变为组群，单变量MLM（人和组群）的下标转换为CFA（变量和人）的下标，也就是个体分值在概念上作为单独的变量（所谓“人也是变量”）（Mehta & Neale,2005）。在广义潜变量模型框架下，前者组间方差和组内方差与后者共同方差和独特方差存在对应关系，可用一套通用公式来表述（Skrondal & Rabe-Hesketh,2004）。因此，嵌套数据结构可用SEM估计（潜增长模型即为典型，参见王孟成等，2014），且具备如整合测量误差、可方便处理多水平中介效应问题等优势（Curran,2003；Bauer,2003）。

循此脉络，路德等（Lüdtke et al.,2008;Preacher et al.,2010）基于Mplus潜变量分析框架系统地阐释了多水平潜协变量（MLC）策略。MSEM建模是一种“分解优先”思路，其基础即使用MLC方法（实即随机效应ANOVA模型），将模型中各观测协变量（除了只在某个层面变化的专用变量之外）自动分解为组内/组间两个独立、正交的部分，考虑作为潜变量（Lüdtke et al.，2008；Lüdtke et al.，2011；Preacher，2015；Preacher et al.，2011；Muthén & Asparouhov，2011）。与此相对，经典MLM中的聚合方法，称为多水平显协变量（MMC）。其中组均值是显变量，而非不可观测的潜在构念，聚合处理实际上相当于将组内微观单位当作无差异个体来对待。而基于MLC思路的MSEM将水平-1变量含有的无法直接观测的组群成分作为潜变量（潜组均值），水平-1单位可以理解为水平-2潜在构念的观测指标。这是二者之间的关键区别。阿斯帕洛霍夫等（Asparouhov & Muthén,2006;Lüdtke et al.,2008）使用数学方法推导证明，在进行多水平分析时，与MLC策略相比，MMC方法在估计组间效应和情境效应时存在偏误。随着组群规模或ICC减小，估计偏误会增加。模拟结果也支持数学推论。

从理论上来讲，如果水平-1指标本身设置就是为了测量水平-2构念，那么使用MLC的方式更适合。在一个更宽泛的尺度上，路德等（Lüdtke et al.,2008）将聚合构念区分为形成性（formative）和反映性（reflective）两种类型。前者假定个体水平数据和组群水平构念存在同构关系。水平-1指标反映性聚合至水平-2构念，参照点是组群水平构念，比如通过对学生的调查测量“校风”，即使抽样比例比较大，应用MLC方式也更适合。后者中，聚合基于离散个体的不同属性，构念主要的目的是反映水平-1个体的差异，参照点是水平-1构念，比如学生家庭社会经济地位。若抽样比例较高，样本量和ICC较大，可使用MMC法。当抽样比例较小而水平-1和水平-2样本量较大时，考虑使用MLC法。如果各组样本量都足够大，两种方法结果应相近。

不过从形式上来看，MLC针对的是单指标观测变量，虽然可以控制抽样误差，但并没有考虑测量误差（Lüdtke et al.,2011）。通过强调各构念多观测指标测量并使用潜聚合方式形成水平-2构念，马什、路德等（Marsh et al.，2009；Lüdtke et al.，2011；Marsh et al.，2012；Morin et al.，2014）将应用于情境效应分析中的MSEM称作双潜多水平模型（doubly latent multilevel model）。因为这样的设置实现了同时对水平-1与水平-2由于题项抽样（sampling items）造成的测量误差和由于在水平-1特征聚合构建水平-2构念过程中个体抽样（sampling of persons）的抽样误差的校正。

依此标准，传统MLM使用MMC策略，属于双显模型，特点是显测量、显聚合，两种误差均未考虑。如果构念采取的是单指标而非多指标测量，亦即未控制测量误差，但通过潜聚合控制了抽样误差，属于显—潜模型，MLC即这种情况（Lüdtke et al.,2011）。CSC指标构建中常用“聚合+组间单水平因子分析”处理方式典型属于潜—显模型，虽然通过多指标控制了测量误差，但没有通过潜聚合校正抽样误差。马森（Muthén,1990,1994）有关组间和组内协方差矩阵的定义式中，尽管经过一定校正并基于多指标潜测量构建，但水平-2构念仍属于显聚合，所以马什等（Marsh et al.,2009）称之为潜—显模型。潜—显与显—潜模型同属部分校正模型。标准MSEM则属于双潜模型，也就是所谓潜测量、潜聚合。

（三）小结

佩恩（Payne et al.,2011）曾指出，作为共享性构念的社会资本指标在使用个体数据聚合之前应考虑组内一致性问题。然而只有少数研究（如Friche et al.,2013）注意到这一点。从测量学角度检视指标类型并考虑组内一致性问题的研究更是付诸阙如。然而在现实社区研究中，由于成本约束的存在，很难同时保证组间和组内较大的样本量。为了保证组间样本量足够，在社区内取30-50个样本的情况较为常见。虽属于“大样本”，但相对于社区规模而言一般抽样比例不高，尤其考虑到社区内部某些方面异质性较高，这意味着存在抽样误差和信效度问题。

SEM的一大优势是通过测量模型设置允许测量误差的存在，并起到净化误差的作用，使得潜变量间的关联估计较少地被测量误差污染，提高估计的准确性。MSEM相当于在纵向也构建了以微观单位（某方面属性）为显变量或指标、以组群层面构念为潜变量的测量模型，从而实现了对测量误差和抽样误差双重校正，减少了由于在水平-2采用简单聚合组均值带来的偏误，组群层面系数估计也得到了校正。

在多水平分析中，对于属于具有共享性特征、氛围型、共识型以及更宽泛意义上的反映性指标，为了增进信度、减少偏误，宜采取双潜模型；对于典型的汇集型、构造性、形成性或可加构成型构念而言，虽然组内一致性并不重要，但信度和抽样误差问题同样存在，简单聚合处理也会带入个体差异。在满足一定条件的前提下，也可尝试以双潜多水平模型建模（Lüdtke et al.,2008,2011）。据此，在CSC测量中，至少对于认知性维度应尝试应用MSEM框架。然而作为MSEM的特例，尽管多水平验证性因子分析（MCFA）的方法在某些领域已有应用，但目前尚未出现应用于集体性社会资本测量方面的案例。

斯达波（Staber,2007）在综述有关区域集群社会资本研究时发现，社会资本效应较弱且有很大的不一致性。当然不排除集体社会资本本身效应量较小，或者不同研究者测量工具存在差异，但测量模型方面的偏差也不容忽视。一般来讲，采用聚合方式容易造成组群层面效应包括情境效应被低估，因此有理由怀疑集体性社会资本测量和分析中某些效应不显著可能部分是由于这个原因。

三、实例分析

以下将使用经验数据，在对有关指标进行必要的一致性和信度评估的基础上，借鉴前述研究成果，尝试以MCFA构建CSC指标体系。

（一）调查与数据情况

本研究所用数据来自作者参与的“A集团‘幸福社区’指标体系构建”项目。A集团是大型房地产开发企业，项目遍布全国不同等级城市。为了调查相对成熟社区，目标总体为当年所有开发小区中交付2年以上（2010年之前）、已接管户数1000户以上、入住率70%以上的74个项目。符合条件的项目分散在一二三线共17个城市，平均入住时长为7.66年（标准差3.62年）。有业委会的占62.2%。

调查根据社区家户规模，采取概率比例抽样（PPS）抽取小区样本，然后在被抽中小区中按门牌号使用等距抽样选取家庭户作为最终样本。家户问卷由符合资格条件的业主（或业主配偶、事实业主）填写，每个小区抽55位业主，共30个小区，设计总样本1650个。问卷调查于2013年8-9月完成。经复核，个体有效样本1544个，合格率93.6%。其中，男性占49.2%。年龄平均43.7岁（标准差12.7岁）。文化程度为大学本科及以上的占五成。

（二）理论模型及相关指标

由于本文主旨在于方法引介而非理论探索，因此在借鉴前述研究基础上，为简单起见并考虑相应方法的适用性问题，这里以认知性社会资本类型为主（至少属于主观判断量表形式的相关指标），考虑互动交往（INT）、志愿主义（VOL）、社区信任（TRU）、认同归属（IDE）共4个维度，选择相应指标纳入模型（负向指标调整方向）。从题项表述来看，虽然具体包含可加构成、直接共识、参照转移模型等不同类型，但从语义来看均以社区或邻里为指向，因此这里不再作具体区分，都视为反映性构念的经验测量指标。

为了保证聚合的适切性，首先采用ICCs、Rwg评估上述指标。尽管本例中个别指标严格来讲属于可加构成模型，但组内一致性估计仍可作为信度的指标（Hofmann,2002）。由于目前还缺乏针对潜在构念信度的评价指标，对潜在组群共享构念进行测量和建模时，需要对各观测题项ICCs（以及组间组合信度）进行评估（Stapleton et al.,2016）。

从结果（见表1）来看，部分指标如“我经常与小区其他居民来往”未达到相关指标常用的临界水平，ICC(1)和Rwg值均处于较低的水平。整体来看，只有4个题项ICC(1)在0.06以上。与ICC(1)相比，ICC(2)整体上较高（不过也有4个题项在0.7以下，1个在0.6以下），其实主要得益于较大的组内样本量。有半数题项Rwg在0.7以下。从Rwg分布来看，不同组群在某些题项上差异也较大，个别指标上有小区低于0.3。概言之，虽然ICC(2)和Rwg处于尚可接受的水平，但ICC(1)总体上相对较低。一方面这说明除少数题项外，测量可产生具有稳定性和代表性的均值，尤其在考虑到组内样本数较大的情况下；另一方面，相应属性差异更多受个体因素影响，社区层面只占相对较小部分。所以，如果未进行指标组内一致性评价而直接进行聚合，实则掩饰了社区内部异质性。根据设计效应（design effect）标准，按平均组群规模55计，ICC=0.02时设计效应即大于一般临界值2。因此本例中虽然部分指标ICC较小，但整体来看相关指标还是提供了进一步使用多水平分析的弱依据。

（三）模型构建与估计

以下使用MCFA构建CSC测量指标体系。假定组间和组内因子具有同构性，均含4个维度。为了便于直观理解，以互动交往和志愿主义维度为例，给出两水平CFA模型图（见下图）。图中，组内模型由因子指向标的箭头头部的圆点代表随机截距，对应于各指标在组间模型中相应的潜变量。表示因子载荷的箭头代表的是斜率。在多水平随机截距模型中，组内方程的截距随机变化，方差存在于组间，实际上就是相应水平-1观测指标的组间效应。

模型使用Mplus统计软件估计。MCFA采取联立法整体输出。模型复杂且水平-2样本量较小，采用贝叶斯估计（未设置先验信息）。为便于比较，基于聚合的单水平验证性因子分析也使用贝叶斯估计。

（四）结果评价

表1给出了MCFA两个层面的结果。作为参照，同时也给出了采取聚合方式处理后社区层面单水平CFA结果。对比两个模型结果可以看到，与前者相比，后者结果中因子载荷均被低估。另外，比较两种不同方式估计的（组间）因子间相关系数（见表2）也可发现，相对于MCFA组间结果，基于聚合方式的单水平CFA结果大多也出现了低估。唯一的例外是互动交往和志愿主义因子之间的相关系数，原因在于两个因子之间组内相关高于组间（见表2）。这与路德等基于情境效应的分析结论一致（Lüdtke et al.,2008）。总的来看，聚合方式所得结果是组间和组内因子相关系数的某种加权平均。

结构效度包括收敛效度和区别效度。对于收敛效度，CFA框架下一般采用建构信度（CR）和平均变异萃取量（AVE）进行评价。不过单水平估计混淆了组内和组间信度估计，无法反映量表真实信度。在多水平框架下，应使用所谓水平特定信度（level-specific reliability）（Geldhof et al.,2014）。由于本实例分析重点在社区层面，而经过潜多水平模型处理组内和组间成分相互独立，这里仅针对组群模型输出结果进行评价。从组间模型来看，各因子标准化载荷均在0.6以上，CR均在0.8以上，AVE均不低于0.6，表明量表结构效度较好。对比表2、表3可以看到，所有因子AVE算术平方根都大于因子之间的相关系数绝对值，表明区别效度较好。

从结果来看，很大程度上是因为未去除个体因素的干扰，基于聚合的单水平CFA模型AVE和CR指标整体上低于MCFA组间结果相应指标。所以可以理解，未使用MCFA处理嵌套数据而造成的因子载荷估计偏差不仅妨碍对概念内部关系的实质理解，而且可能会影响对量表内部结构效度的判断。

组间/组内因子载荷和因子间关系的比较也有意义。结果显示，组内和组间因子载荷存在模式差异。在社区层面，除了互动交往和志愿主义因子外多数因子间相关程度都要高于组内。这是因为两个维度多个题项上组内一致性较低，指标本身混杂了更多的个体因素影响，其间关系也更多地表现在个体层面。另外，本例中，单独看共享性指标甚至参考点转移题项（如“小区里大多数人愿意相互帮助”）相对于个别可加构成指标（如“我对小区未来发展充满信心”）并未显现出更高的组内一致性。不过，参照点明显指向的社区层面、更为典型的认知性维度（社区信任、认同归属）在整体上具有较高的组内一致性，组间方差占比相对较高， CR和AVE也更大。

四、总结与讨论

“共同领会”与“默认一致”是传统共同体的本质（滕尼斯，2019）。认同建立更是现代社区的基础，区别不同共同体的关键是看它们各自被想象的方式（安德森，2011：6）。对于CSC，罗家德、方震平（2014）担心基于个体认知的测量可能问出的主要是个人对集体行动的认知。从测量学角度来讲，对于此类集体性指标的构建，关键问题并不是高水平构念是否需要从个体层面进行测量（因为现实中大多数指标只能或必须基于个体水平搜集数据），而是要在明确各类指标类型的基础上，对相关指标的聚合前提进行评估，并选择适合的测量模型。

本文关注的主要是CSC的认知性维度，主体为反映性指标，多带有共享性特征。在构建高水平构念时，基于聚合值的组间单水平因子分析方法实际上未有效分离个体因素，因此存在估计偏差，尤其是考虑到组内一致性较低的实际情况。实例计算显示，指标中欠缺组内一致性的比例很高，简单聚合处理面临风险，需要对由此形成的高水平构念信效度保持必要警惕。在这一点上，罗家德、方震平（2014）对目前通行CSC指标测量的担心确有必要。其实范戴斯（Van Deth,2003）较早在总结社会资本测量存在的问题时也表达过对聚合方法的质疑，指出集体事实需要谨慎发展研究策略，以避免落入聚合数据的陷阱。

目前来看，在基于MLM进行CSC的研究中，一般都会考察结果变量ICC的大小，以判断是否有必要进行多水平分析。然而令人疑惑的是，CSC各观测指标组内一致性和信度的评估被普遍忽视了。基于MSEM框架的处理避免了指标简单聚合存在的信效度问题，从个体层面测量数据萃取“纯正”的CSC，以多水平模型呈现人们的社区想象或社区话语的现实结构，在理论和方法上均具有优势。对比两种方法所得结果可看到，该思路所得因子载荷和组间因子相关一般都高于基于简单聚合的结果。如果说前者相对准确，后者则存在低估的偏差。

需要说明的是，测量方法的规范和改进有助于准确估计相应高水平效应，但这并不意味着在具体题项上社区内部同质性高，这是不同的两个问题。从本例数据分析结果来看，ICC(1)变化范围在0.02到0.13之间（简单平均0.056）；尽管组内样本量较大但半数指标ICC(2)和Rwg未超过0.7。可见相对于组织、教育研究，结构更为松散的社区诸多属性组内一致性处于较低的水平。因此，在缺乏必要评价的情况下，直接以取均值的方式将相关指标聚合至社区层面，实则掩饰了社区内部可观的异质性，容易造成误导。正如桂勇、黄荣贵（2006）综述性研究所得的结论，目前的城市社区并没有浓厚的共同体色彩。当代中国的现代社区建构进程也许只是刚刚开始，而且具有自身的鲜明特色。在CSC测量乃至一般性城市社区经验研究中，学者们不宜对社区过于浪漫化，而是需要选择更适合的经验数据、更具统计效度的建模方法，避免不经意间夸大社区效应，在强调作为共同体一面的同时也要对内部分化给予充分关注。因为这种分化不仅威胁着聚合的效度，而且具有实质性的理论与现实意义。

本文是对采取MCFA进行集体性社区社会资本测量的一次尝试。从结果来看，该技术路线具有可行性。可以预见，由于MSEM在测量以及处理多水平中介和调节效应方面优于传统MLM（Zhang et al.，2009；Preacher et al.，2016），在未来社区研究中将获得广泛的运用。

最后，需申明本研究的几点局限，也是后续工作有待深入研究或改进的若干方面：（1）实例数据社区层面样本较小且组内ICC普遍处于较低水平，这给模型估计带来一定困难。实际上，相对于MLM，MSEM运算量大，更需要大样本支持（尤其是组间）（Lüdtke et al.，2008，Lüdtke et al.，2011）；（2）实例中样本只包括A集团开发的小区，小区之间可能存在一定同质性（不过即使如此也并不影响基于Rwg的组内一致性判断）；（3）实例以认知性维度指标为主，未包括典型的结构和关系性维度测量。需要指出的是，相对于传统方法，MSEM的引入方法上虽然可以增进非全局性特征构念测量的信效度，然而由于难以捕捉内生的复杂互动过程，在结构性维度测量方面仍存在局限。MSEM本质上属于心理测量学（psychometric）而非生态测量学（ecometrics）（Sampson,2011）框架。高水平构念类型学区分的一个后果恰恰是排除了这部分内容。令人遗憾的是，对于个体间互动涌现集体后果的问题如何进行经验研究，尚未得到有效解决，因此如何在CSC指标测量中更有效地纳入结构和关系性维度并与认知性维度有效整合，仍是一个待解之题。

责任编辑：梅笑

图片来自网络

此文经本微信公众号工作人员重新排版。

篇幅有限，参考文献、脚注省略。