“有一只熊掉到一个陷阱里,陷阱深19.617米,下落时间正好2秒,熊是什么颜色?“

“某人出生于20世纪70年代,某年他发现从当年起连续10年自己的年龄均与当年年份数字之和相等(出生当年算0岁)。问他在哪一年时,年龄为9的整数倍?“

“柏拉图认为处于变化之中的事物不是真正的存在,持这种观点的人会认为什么最真实?“

看到这些,仿佛又想起被奥数支配的恐惧。但这不是脑筋急转弯,也不是要选拔最强大脑,而是你找工作时候马上就要面对的问题。

这些奇葩的问题有一个共同的名字:行测。

又多又难,又杂又怪

还没经过校招拷打的同学可能会纳闷这些问题是什么玩意,但对于已经步入职场的人来说,则可能会心一笑。现在企业在招聘中,尤其是在校招当中,最常见的初步筛选测试手段就是“行测”。

行测的全名是行政职业能力测验,这个词其实本来是公务员考试中专用的。企业在招聘的笔试中常常参考公务员考试的行测题来设计题目,甚至直接从历年的行测题库中抽出题目来选拔人才,有时候也会改个名字,叫“通用测试”、“综合能力测试”之类的。因而“行测”也就从公务员考试专用,变成了企业招聘中通用的一种考查形式[1]。

所以,中国的行测其实指代了各种各样的职业能力测试,只要不是专业能力考核,涉及能力素质的笔试,最后都被塞进这个大筐里。

所以别再问“为什么我明明不是来公司搞行政的,还要考行测”了,“行测”考的从来就不只是行政能力。

这也就难怪很多人做行测的第一感受就是,“这么多题,怎么做得完?”毕竟行测题需要考察的方面实在太多太杂了。

题量大、题目偏难怪,这是行测留给很多应聘者的最大印象 / 图虫创意

标准的行测至少涉及常识判断、言语理解与表达、数量关系、判断推理和资料分析五个部分[2]。其中仅“常识”一项,考察范围就大得没边,上到天文下到地理,全都算常识。也许你是天文爱好者,但你也未必听说过“掩星”这个词,但是它却可能在行测题中作为“常识”来考察[3]。

更有甚者,集历史、生物、科技知识于一体,堪称对于“常识”的终极考验,比如下面这题——

以下仿生生物学的应用对应关系不正确的是:

A.子弹头列车——翠鸟

B.发光纤维——萤火虫

C.维克罗尼龙搭扣——苍耳

D.全天然空调系统建筑——非洲白蚁巢穴

就算你是《动物世界》骨灰级死忠粉,也未必搞得清楚发光纤维和萤火虫的发光原理不同,而全天然空调系统建筑灵感来源于非洲白蚁的巢穴。

非洲白蚁的巢穴具有保持温度恒定的功能,人们受其启发设计了一种全天然空调系统建筑,而这也是行测所考查的常识之一 / unsplash

别问,问就是你缺乏常识。

行测题又多又难、又杂又怪,那怎么办?猜呗。既然认真做不但可能做不对,还肯定做不完,于是猜题就成了很多考生做行测题时候的一种常见策略。

广东省人事考试中心参与的一项研究发现,受到题目数量和难度的影响,考生在做行测题时常常靠猜,这让行测的选拔功能大打折扣[4]。

研究显示,由于题量大、难度大,行测考试中猜题的现象很普遍 / unsplash

选项全选C,说不定比你认真做还对得更多。这其实也不能怪你,得怪题目本身。

被包装的智力测验

为什么偏难怪的题目已经降低了笔试本身的选拔功能,企业还是如此执着地采用行测来招聘呢?这就涉及到企业招聘的具体思路了。

企业当然想要熟练掌握业务的人才,但大学毕竟不是职场。对绝大多数企业而言,他们不可能一上来就从校园里找到直接能展现工作业绩的人,单纯考察具体的业务知识是不现实的。

在校招里,企业真正想要的是那些具有更大“潜力”的人,说白了,很多东西你可以现在不会,但你可以慢慢学嘛;但你要是没有潜在能力,以后也很难把活干好,这对企业而言才是最大的麻烦[5]。

可问题在于,“潜在能力”这个东西颇为玄学,考查起来也不容易。企业急需找到一种现成的,比较靠谱的能力检验方法——浏览一番过后,已有的“行测”就成了最为方便的选择[6]。

我们所说的的行政职业能力测验其实是“一般认知能力测验”或者叫“一般能力倾向测验”的魔改版。

当企业说行测的时候,他们指的其实就是“一般认知能力测验”,而非专指公务员笔试中的行政能力测验。

而这个听起来高大上的“一般认知能力测验“其实一开始是由智力测试发展来的,也就是所谓的“测IQ”。

智力测试是最早的能力倾向测试之一 / unsplash

想起小时候在网上做的各种不靠谱的智力测试题了吗?一个人做不同版本的智力测试,结果有时候能比肩爱因斯坦,有时候又接近智力残疾,可见那些自称“国际标准”、“最权威”的智商测试有多不靠谱。

事实上,智力测试不靠谱的一个最明显表现就是——你居然可以通过刷题来提升智力测试成绩,难道刷几套智力题你的智力就飞涨了吗?显然不可能。这只是说明所谓的智力测试其实非常依赖题目语境罢了[7]。

智力测试其实还有一段不堪回首的黑历史:在1924年的美国,人们甚至把智力测试结果作为“优生学”依据,强迫低智力的人绝育[7][8]。

尽管后来IQ测试不再那么暗黑,但也饱受争议。20世纪后期西方普遍出现了抵制智力测验的现象,有些学校明文禁止对学生施测智力测验。因为仅凭天生的智力考核学生,无异于一种歧视[6]。更何况“智力”这一概念本身就很不客观,不同文化环境中成长的人,会有不同类型的经验和才智,而其中哪些被计入“智力”却是由出题人说了算[8][9]。

为了尽量克服这些弊端,人们尝试对智力测试进行改进。既然标准太单一,那我们就多测几个方面;既然题目太主观,我们就多参考一些科学研究的成果。在不同版本的改进方案中,一般认知能力测验就是其中的一种。

一般认知能力测验听起来很美好,但很大程度上却是换汤不换药。很多研究指出,一般能力实际上仍然代表狭隘的智力概念,并不能有效体现那些我们后天习得的实践的能力[11]。

许多研究都反对一般认知能力测验,认为其所测试的所谓能力根本不科学,受命题者的主观因素干扰太大,容易产生许多偏见——一个非英语母语的人接受认知能力测验,很容易在认知能力测试中被判断为言语理解和表达能力有问题,但这显然不准确。

让非英语母语的人和英语母语接受一样的“言语理解和表达能力”测验,显然是不够公正的 / 图虫创意

很多事情对你而言是常识,对我而言却不是,这并不是因为我笨,而是因为你我的成长环境不同[12]。

卡罗尔三层智力理论把简单的智力拆分成三个层次、数十种不同的认知能力,以求更加科学和精准。这一理论是很多认知能力测验的理论基础,2018年的一项研究在分析了几千名参与卡罗尔式认知能力测验的测试结果之后发现,它测出来的总分仍然只和“智力”相关,没法确切体现那些不同的认知能力。这就又回到了“测IQ”的老路上[13]。

即便不考虑一般认知能力测验可能含有的歧视等负面作用,它也绝非一种万能的选拔方法。一项研究显示,一般认知能力测验对工作绩效预测的平均效度系数为0.65。效度系数越高,表明测验结果对测验目的实现得越好。而在和诚信测试或结构化面试等手段结合起来之后,效度系数可以提升到0.78和0.76。[14][15]。

国内一项研究在调查了402名被试者之后发现,那些在行测中发挥更好的在职人员,确实在工作中掌握了更多的营销知识。这一点容易理解,因为我们看看行测考察的能力内容,很多无非是拓展版本的语文、数学题,因此行测成绩很大程度上体现的就是基本的学习能力[1]。

但作为企业最关心的工作绩效,却反而和行测成绩没有显著关联[1]。企业原本想通过行测在校招中招到摆脱了“学生气”的工作人才,但兜兜转转到最后,似乎考试考出来的仍然是“做题家”,白绕了这么大圈子。

行测更直接考查的是学习能力,而工作绩效和行测成绩之间的关联反而不强 / pexels

很多行业和岗位要求掌握的并不仅仅是“知识”,而是“技能”或者“素质”等更加多维度的内容,显然,本身具有如此多局限性的行测,不可能为每行每业都提供高效的人才选拔。国内许多企业为了省事,直接把公务员考试的行测题库拿来用,想筛掉素质偏低的人,其实是囫囵吞枣。

面对行测,别太钻牛角尖

行测作为一般能力测试的一种方法,只能说“还有点用”。在实际招聘中,一般认知能力测验最好能与其他工具结合起来使用,比如个人的简历资料、无领导小组讨论、结构化面试以及人格调查问卷等[15] 。

结构化面试是行测的替代方案之一 / unsplash

辛辛苦苦准备了几个月的应届生们,宁愿企业来多考察一些专业知识,或者来一场能充分展现个人能力的无领导小组讨论,而不是面对一堆多边形去数角、在绕口令里做阅读理解。

如果非得面对行测,那么不妨看开一点,别钻牛角尖。毕竟,考查心理素质,本来也是一般能力测验的目的之一。

搞清楚行测考什么,考试就有的放矢,稳住不慌:关键不是看到奇奇怪怪的题面,而是发现背后想要对应的能力。

比如,那些表达繁复的选项,往往是想考你的逻辑思辨能力,这时候只要心里放着哪几种思维方式,往往就能事半功倍。比如,那些提问“至少……才能保证”的题目,其实是想要你用“最不利原则”思考问题,这时候要做的关键就是大胆设想最坏情况,而不是单纯死磕题面里给出的条件[16]。这样一来,正确选项或许好找很多。

在比如行测中非常常见的图形推理题,确实和小时候奥数题里的“找规律”是一个套路,需要你尽量发散思维,看到各种不同规律的可能性。面对这种题,刷题往往很有用。各大快消、金融、互联网公司这类行测题的重复率相当之高,往往是把几种找规律的方法排列组合:数边、数点、数角、看封闭区域、看单复数……

行测中常见的图形推理题其实和小时候常做的奥数题是一个套路 / unsplash

正是因为企业笔试中的行测题偏难怪,所以一味押题反而不是明智的选择。押来押去,不仅难以命中具体考点,还容易搞崩了自己的心态。

心态好,就已经赢在了起跑线上。国内有研究者对64名大学生进行了实验,让他们在经历剧烈情绪波动之后做行测中的言语推理和图形推理题。结果表明,那些使用了情绪调节策略的大学生所取得的平均成绩比没有使用情绪调节策略的学生高出16%左右[17]。

合理使用情绪调节策略,可以显著提升你在行测中的表现 / unsplash

退一万步说,考虑到行测变态的题量,在考试中时间有限时适当放弃其实也是非常明智的一种策略。

毕竟,等你读完这篇文章,你至少可以对自己说:“错的不是我,而是行测本身”。

参考文献:

[1]李兵兵.(2012).行政能力测验的实证研究(硕士学位论文,广州大学).

[2]国家公务员局.(2021).中央机关及其直属机构2022年度考试录用公务员公共科目笔试考试大纲.

[3]项凤华.现代快报. (2016).掩星是啥?“最严”国考笔试 不少人看到考题就蒙了.

[4]林绚晖,戴学敏,林念 & 黎颖.(2011).行政职业能力测验的概化理论分析..(eds.)增强心理学服务社会的意识和功能——中国心理学会成立90周年纪念大会暨第十四届全国心理学学术会议论文摘要集(pp.28)..

[5]王峰.(2018).基于供需耦合的大学生就业能力结构优化及实证研究(博士学位论文,中国矿业大学).

[6]张书涛.(2007).我国行政职业能力测验的范式探讨. 理论观察(06),64-65.

[7]Allison Whitten. Do IQ Tests Actually Measure Intelligence?.(2020). Discover Magazine.

[8]Murphy, K. R. (2002). Can conflicting perspectives on the role of g in personnel selection be resolved?. Human Performance, 15(1-2), 173-186.

[9]朱胜强.(2009).一般认知能力测验的修订及其校验(硕士学位论文,江西师范大学).

[10]Anastasi, A., & Urbina, S. (1997). Psychological testing. Prentice Hall/Pearson Education.113-114

[11]Sternberg, Hedlund. Practical intelligence, g, and work psychology [J]. Human Performance, 2002, 15, 143-160.

[12]John Rosales and Tim Walker.(2021).NEA news.The Racist Beginnings of Standardized Testing.

[13]Benson, N. F., Beaujean, A. A., McGill, R. J., & Dombrowski, S. C. (2018). Revisiting Carroll’s survey of factor-analytic studies: Implications for the clinical assessment of intelligence. Psychological Assessment, 30(8), 1028.

[14]Schmidt, F. L., & Hunter, J. E. (1998). The validity and utility of selection methods in personnel psychology: Practical and theoretical implications of 85 years of research findings. Psychological bulletin, 124(2), 262.

[15]Outtz J L.The Role of Cognitive Ability Tests in Employment Selection[J].Human Performance, 2002, 15(1/2): 161-171.

[16]孟洋.(2016).省考“行测”新思维. 人才资源开发(03),39-40.

[17] 张敏,卢家楣,谭贤政 & 王力.(2008).情绪调节策略对推理的影响. 心理科学(04).

作者:李梦一