Final Round AI最近抛出一个清晰的论断:行为面试正在取代编程面试。这个方向是对的,但框架过于整洁。真实版本更值得拆解,它沿着一条大多数候选人忽略的分界线展开——实时编程正在丧失辨识力,行为和系统设计轮次承接了更多评估权重。但编程面试本身没有消失。在大公司里,它被加固、被捍卫,而非被淘汰。你正在面试什么样的公司,直接决定了哪一套叙事适用于你。
一位参与过大量面试的工程主管Yusuf Aytas,在自己题为《AI毁了面试》的文章里直接拆开了核心机制:“坐在你面前的候选人是真正在思考的那个人——这个前提现在不存在了。”一个干净的解法,不再能区分强候选人和那个拥有一台好辅助加第二块显示器的人。这不是孤立感受,评估平台CodeSignal在规模化执行技术测试后拿出的数据,已经让这种现象无法再用“传闻”来解释。
CodeSignal发现,2025年标记出的疑似作弊行为比率,从2024年的16%翻倍攀升到了35%。针对入门级别岗位的评估,这个数字更是从15%飙升到了40%。最常见的违规信号包括屏幕外参考调用和答案调用。一家运营技术测试的公司,观察到作弊率在一年里直接翻番,这从根本上动摇了观测式编程评估的根基——如果相当一部分候选人正在完成任务,而你无法确认完成者究竟是谁,那么观测结果还能提供什么样的判断依据。
这里有一个值得被厘清的机制,因为竞品分析往往直接断言趋势走向,却绕过了这个关键环节。编程面试从来都是一个替代性指标。它建立在一种假设之上:观察一个人解决问题,能让你推演他在真实工作中的表现。这个替代性指标的有效性,依赖于一个前提条件始终成立——面前坐着的人是正在思考的那个人。一旦这个条件消失,替代性指标给出的读数就开始失真。这就是为什么,即便保持完全相同的问题集合,实时编程面试的评估效力已经在近两年的时间里发生了实质性衰减。
把编程面试剥离代码层面的观察,换一种方式理解面试官的真实处境,或许更容易看明白。如果把一场实时编程比作直播,面试官要判断的不是呈现出来的结果是否成立,而是这个结果是否由当前这位主播亲手产生。当技术手段足以在直播过程中无缝介入提示、修正甚至完整方案时,面试官事实上正在评估一场合作表演,却无从判断哪一部分来自主角。这恰好解释了为什么行为面试轮次,尤其是围绕复杂系统设计讨论的对话,正在接替这个功能——因为这些对话要求候选人暴露思考的毛边、停顿、反复权衡以及选择放弃的路径,而这些恰恰是现阶段的工具最难伪装的部分。
把目光拉回2026年的招聘公告数据,这次面试结构变迁的下游动力会变得更加清晰。Four-Leaf公司分析37920份职位公告后,捕获到一个细微但影响深远的转向:人工智能的通晓能力,已经被当作工程师工作方式的默认组成部分,而不再是一种专项资质认证。仅有14.6%的职位公告明确列出了某个具体的人工智能工具名称,并且几乎没有公告把掌握某一个工具设为硬性要求。这传达出一个明确的信号——公司默认你会在工作流里融入AI,但已经不必在每份岗位描述里重复书写这条默认项了。
这个预设,恰好就是面试困境的根源。如果在日常工作中使用AI来编写代码、推理技术方案已经被视为常态,候选人必然会使用同样的工具来准备面试,并且在能够触及的环节里,用同样的方式通过编程筛选项。那个为了衡量特定能力而被设计出来的环节,“这个人能否在观察下产出可运行的代码”,现在已经部分蜕变为,衡量候选人运用辅助工具的能力。面试官清楚这件事,所以他们开始给实时编程轮次给出的信号打折扣。
信号打折不是一次性完成的修正,而是一个在面试官群体中逐渐扩散的分化过程。一部分面试官开始把编程轮次直接降格为“基本门槛通过性测试”,不再试图从中提取差异化的能力信号。另一部分则反向操作,在编程环节筑起防火墙,比如要求在白板上脱机编码、限定只能使用指定版本的本地编辑器,或者在面试环境中完全切断外部网络。这正是大公司正在做的事,他们加固编程面试,不是因为它依然灵敏,而是因为失去这个可量化的筛选工具之后,替代方案的规模化成本太高。对应的,中型和快速扩张阶段的公司,由于招聘量灵活且需要多元判断维度,把系统设计和行为轮推向决策核心位置的进程要快得多,有时甚至直接砍掉原本留存在流程中的线上编程关卡。
热门跟贴