AI越来越像人,于是人类开始被迫证明自己不是AI。

一件,是英联邦短篇小说奖的一篇获奖作品,被第三方AI检测工具判定为“100%AI生成”。主办方用Claude复核,却没有得到相似的结果。

于是,一种新的秩序出现了。

过去是机器努力通过图灵测试,证明自己像人。

现在,越来越多人开始参加一场反向图灵测试:证明自己不是机器。

01

今年5月,英联邦短篇小说奖的一篇获奖作品,引发了一场大型“鉴AI”争议。

引发争议的是特立尼达和多巴哥作家贾米尔·纳齐尔(Jamir Nazir)的短篇小说。

打开网易新闻 查看精彩图片

随后,AI检测工具Pangram给出了一个看起来非常确定的判断:100%AI生成。

100%这个数字看上去像铁证,可它并没有立刻变成裁决。

打开网易新闻 查看精彩图片

于是,事情进入了一个极其荒诞的环节。Granta杂志尝试用Claude复核这篇小说,想让另一个AI来判断它是不是AI写的。

结果,Claude没有给出能够一锤定音的答案,也就是说,Pangram言之凿凿判成“100%AI生成”的作品,Claude却表示确定不了。

事件的起因,是她在采访中谈到,自己会使用AI辅助构思、资料整理、初步研究和事实核查。

打开网易新闻 查看精彩图片

这个说法很快引发外界讨论。要命的是托卡尔丘克马上要发新书,于是大家都在热议她的新小说是不是AI写的。

随后,托卡尔丘克不得不公开澄清,自己将于2026年秋季出版的波兰语新书,并不是由AI或其他人代写。她强调,几十年来,她一直独自写作。

说到底,现在AI确实越来越强了,鉴AI正在变得越来越困难。

这比“AI能写小说”更麻烦。

全程录像“自证清白”的画师欲哭无泪

这是现在流行“空口鉴AI”的一个核心动因。

换句话说,大家“鉴AI”是可以理解的,背后其实是某种恐惧——这是人吗?这是AI吗?我又是谁?我们是谁?

论AI带来的冲击,绘画圈是不陌生的。我们早在几年前就讨论过AI对绘画圈的冲击,以及很多画师对AI的抵制。

然而在当下,画师们面对的麻烦已经不仅仅是需要放着AI炼化自己的成果,而是自己手搓的作品被“鉴AI”。

在社交平台搜索“画画UP自证”,会看到很多案例。

有的画师被“鉴AI”之后,录屏展示所有的图层,以证明作品是出自自己之手。

打开网易新闻 查看精彩图片

但很多时候,这并不足够。

一位插画师朋友告诉我们,现在很多插画师会在绘画的时候全程录屏,防止被“鉴AI”的时候难以自证,这也是目前最稳妥的做法。

如果没有录屏,或者是有录屏“证据”但是仍然被怀疑是“印着描摹的”,那么还有下一步——对赌。

是的,绘画界因为AI已经发展出了“鉴AI”方和“被鉴AI”方的对赌。在我们看到的一个案例当中,发帖人摆出若干理由如“头发断联”“肩颈结构有问题”等,鉴别某画师的作品疑似是将AI图垫在下方描图或者照着AI图临摹。

双方以2000元对赌,最终画师“自证成功”,发帖人给AI画师支付2000元。

打开网易新闻 查看精彩图片

一般来说,“对赌”当中的“自证”环节,是双方约定时间进行一场绘画直播。而且直播需要多机位,比如一个机位展示屏幕作图过程,另一个机位录制画师画画的样子,以免有人“代笔”。

从很多画师的“自证帖”当中不难看出无奈的情绪,他们往往会感慨“终究轮到我了”,并发誓“这是第一次也是最后一次自证”。

就这样,一边痛恨“空口鉴AI”,另一边真的轮到自己了却不得不“自称清白”,实在难受。

打开网易新闻 查看精彩图片

有“鉴AI”但是画师“自证”失败的案例吗?有。但是这依旧不能让“鉴AI”的行为变得理直气壮一些。毕竟“鉴AI”的成本,几乎没有。

而“鉴AI”的手段,更是粗糙——靠人眼。

这里就不得不提到最近的一个笑料,一个X用户发了一张图,说是自己用AI生成的“莫奈风格图”,还让大家“尽可能详细地说明它为什么不如真正的莫奈”。

打开网易新闻 查看精彩图片

帖子后来700万浏览量,评论区不少人开始认真“鉴AI”,说它缺少深度、颜色不统一、没有人味、构图不如真迹,甚至有人从笔触和空间感上分析得头头是道。

打开网易新闻 查看精彩图片

结果反转是:那张图本来就是莫奈真迹。

“鉴AI”到底谁说了算?

所以这其实是对AI越来越像人的恐惧,与没有完美“鉴AI”手段之间的矛盾。

打开网易新闻 查看精彩图片

AI检测工具,也是在看“看起来像不像AI写的”。

打开网易新闻 查看精彩图片

在绘画领域也一样。有的画师就哀嚎——确实结构画得有问题,那是因为我技艺还需要修炼,不是因为这是AI画的呀!

结果其中89篇至少被一个检测器标记为AI生成;平均误报率达到61.22%;还有18篇被7个检测器一致判定为AI生成。也就是说,这些学生明明是在写一门外语,却因为表达更规整、更接近模板,被工具当成了机器。

当然,2023年、2024年的检测工具不能简单等同于今天的检测工具。过去几年里,商业检测器确实在迭代,一些新工具在特定测试里的表现已经明显提升。

但问题并没有得到解决。

“误判”没有被完全消除,就会给矛盾留下缝隙。

毕竟,工具给出的本来是概率,但落到人身上,就变成了指控。

04

说好的“水印”呢?

更大的问题在于,AI公司是不是应该做“来源标记”?

给所有AI内容打上原生“水印”、去不掉的那种,不就可以解决鉴别问题?

但今天的AI水印早就不只是这种肉眼可见的记号。

打开网易新闻 查看精彩图片

在图像和视频领域,这些方案已经开始落地。

谷歌DeepMind的SynthID可以给Imagen、Veo、Lyria、Gemini等工具生成的内容嵌入隐形水印。

打开网易新闻 查看精彩图片

这说明,AI公司也清楚只靠肉眼判断“像不像AI”是不够的。它们已经在尝试用元数据、内容凭证、隐形水印和平台标签,为AI生成内容留下机器可读的来源信号。

更关键的是,这些方案通常只能识别接入了对应系统,并且保留了对应标记的内容。也就是说,谷歌的SynthID主要识别带有SynthID的内容,OpenAI的内容凭证主要说明内容来自OpenAI系统。只要内容来自没有接入标记的模型,或者经过多次搬运,来源链就可能断掉。

半年后,OpenAI因为准确率太低将其下线。

到最后,回到“鉴AI”与“自证清白”的两方拉扯上,以上提到的所有水印方案,还不能做到万无一失。

人类有一句话是“道高一尺魔高一丈”,还有一句话是“上有政策下有对策”,只要人类还相信这两句话,“鉴AI”就不会停止。