大家好,我是五观不正。今天说一件挺荒诞的事:你避开广告、专门去看第三方测评,结果你看到的那台“测评机”,可能并不是普通消费者买到的那台手机。

你进化出了防骗技能,但厂商进化得更快。

图片提示词:一只手拿着一部智能手机,屏幕上显示模糊的性能测试图表,背景是暗色调的桌面,光线从侧面打来,氛围感偏冷峻,文字不可辨认

打开网易新闻 查看精彩图片

你以为在绕开广告,其实走进了第二层

先说一件你我都做过的事:买手机之前,专门去找博主测评,因为“测评总比广告可信”。

这个逻辑无懈可击。测评博主上手真机、跑游戏、测帧率、看功耗,总比厂商海报上那几行大字靠谱。

这是一个完全理性的消费策略。

但央视网 2026 年 6 月 28 日的一期节目,把这层逻辑撕开了一道口子:手机厂商与网络测评博主之间,可能暗藏一套影响测评结果的“作弊”链条。

具体怎么影响?可以分三层看。

第一层,是测评样机。部分媒体机、送测机可能并不是普通市售状态,而是经过特殊调校的版本。硬件看起来一样,软件策略不同,最后跑出来的性能表现就可能不一样。

第二层,是系统识别。据多家媒体转述相关报道,部分机型可能通过固件或云端策略,识别测评账号、设备状态或测试环境,然后切换到更激进的性能模式。

注意,这里最可怕的不是“跑分 App 被识别”,而是手机可能知道“现在是谁、在什么环境下测它”。

第三层,是云端调控。服务器可以远程下发性能配置,改变手机在不同时间、不同场景下的表现。普通用户未必能察觉这种变化。

这就让“第三方测评”这件事变得尴尬了:你以为自己绕开了广告,结果你看到的,可能仍然是厂商想让你看到的那一面。

数字说话,差距是真实的

极客湾 Geekerwan 在 2026 年 2 月 15 日发布过一支手机游戏性能横评视频。据公开资料和媒体转述,这次测试使用的是 44 台自购零售版旗舰手机。

重点是“自购零售版”。

不是厂商送测,不是提前沟通,不是拿到手就已经被安排好状态的媒体机,而是普通消费者理论上也能买到的零售机。

这支视频后来在多个平台被下架或传播受限。极客湾随后曾通过网盘公开视频文件,并说明这次下架并非普通法务投诉路径。

视频里最值得关注的,不是某一台手机跑得高不高,而是“媒体机表现”和“零售机表现”之间的差距。

据视频存档和公开转述,部分机型的零售机表现明显低于媒体机:有的游戏帧率明显下滑,有的持续满帧时间大幅缩短,也有机型的表现相对稳定,未见明显缩水。

这至少说明一件事:测评样机与普通零售机之间的差异,不能简单用“技术限制”四个字解释。厂商需要给消费者一个更透明的说明。

打开网易新闻 查看精彩图片

这个结构为什么能存在

这里要说一件更让人难受的事:不是每个环节里的人都在主动撒谎,而是这个结构对里面的很多人来说,都有自己的“合理性”。

厂商要新品声量,要首发口碑,要横评里好看的曲线。

博主要样机、要资料、要流量,也要维持和厂商之间的合作关系。

消费者要省时间,不可能每台手机都自己买回来测,只能相信那些看起来更专业的人。

于是问题就出在这里:测评看起来是消费者的防骗工具,但它的上游——样机来源、系统版本、固件策略、云端配置——很多时候仍然掌握在厂商手里。

不是说博主一定主动配合了什么。

真正的问题是:当“测评的输入端”不在博主手里,测评就很难完全站在消费者这一边。

手机厂商在性能测试里“优化表现”,并不是新鲜事。

2013 年,三星 Galaxy S4 就曾卷入基准测试争议。媒体报道称,相关代码可以识别基准测试应用,并让设备在测试场景下以更高频率运行。

当年的争议里,有一个很典型的数字:Galaxy S4 在部分基准测试应用中,GPU 可以运行到约 532MHz;而在普通使用条件下,频率上限会被压到约 480MHz。

2019 年,三星在美国就 Galaxy S4 基准测试集体诉讼达成和解。据 The Register 报道,相关诉讼金额为 1340 万美元,其中 280 万美元进入和解基金,每位 Galaxy S4 购买者可获得约 10 美元赔偿。

这件事的意义不在于 10 美元有多少。

它真正说明的是:如果厂商让消费者以为自己买到的是测评里那种表现,但实际到手后并不是,这就不只是“参数调校”问题,而是消费者知情权问题。

从 2013 年到 2026 年,技术当然升级了。

早年的争议更多是识别基准测试 App;现在的问题,则可能变成识别测评环境、识别账号状态、云端实时调参。

识别精度高了,结构没变。

这不是阴谋论,而是一个更现实的问题:当手机越来越像一套被远程管理的软件系统,普通消费者到底还能不能知道,自己买到的那台机器,真实表现是什么?

你用来防骗的工具,基础设施归谁管

说实话,这件事最刺痛人的地方,不是某台手机跑少了多少帧。

真正刺痛的是:消费者不信广告,转去看测评,这是完全合理的进化。可如果测评样机、测评环境、系统策略和云端配置都可能被厂商影响,那消费者其实只是从第一层广告,走进了第二层广告。

广告你看得见,所以你可以不信。

但一段专业测评视频、一张帧率曲线、一组功耗数据,看起来太像“事实”了。

你不会本能地怀疑它。这才是最危险的地方。

你以为自己多了一双防骗的眼睛,但那双眼睛可能早就被厂商校准过方向。

打开网易新闻 查看精彩图片

那你怎么办

没有完美办法,这就是现实。

但有几个相对接近真实表现的方法:

第一,优先看自购零售机测评。样机来源越接近普通消费者,参考价值越高。

第二,看长期测试,不只看首发测评。首发阶段最容易被营销节奏、系统版本和样机策略影响。

第三,看原始数据是否可追溯。比如测试环境、系统版本、游戏版本、室温、帧率曲线、功耗记录,有没有交代清楚。

第四,看不同测评之间是否互相印证。如果只有一家说好,另一批零售机测试全都翻车,那就要警惕。

最重要的是,以后别再把“测评”当成天然中立的东西。

测评当然比广告有价值。

但测评不是神谕。测评也有供应链,也有利益结构,也有输入端。