AI检测工具曾被寄予厚望,人们期待它能干净利落地解决互联网上日益泛滥的低质内容问题。但实际情况是,这些工具的表现跟抛硬币差不多。学术研究和独立测试反复证明,主流检测器将人类写作误判为AI生成的比例高到让它们产生了反效果——更麻烦的是,随着AI写作水平提升,这个问题只会变得更糟。然而,真正区分机器生成文字和人类写作的那些特征其实相当稳定,一个有经验的读者无需任何软件辅助,就能可靠地识别出来。
AI现在似乎成了“巧干而非蛮干”的终极捷径,这一点在教室和一些工作场所表现得尤其明显。像ChatGPT这样的工具用来写购物清单或做头脑风暴确实不错,但它们同时也制造了成堆的低质内容。作为一名教授,我几乎每天都能在收件箱里看到ChatGPT、Claude等工具产出的内容。坦白说,这些内容越来越容易辨认了——不是因为用了什么“AI检测器”,而是因为它们写出来的东西可预测得让人难受。
其中一个最大的警示信号,是我称之为“维基百科腔调”的东西。这类文字语法完美无缺,却完全没有灵魂,依赖模糊、夸张的语言,把提示词的内容直接回吐给我。如果一个平时写东西断断续续的学生,突然交上来一份“多面向分析”,还用了“交织”或“深入探讨”这类词,我就会起疑。AI对陈词滥调有天然的偏好,而且它忍不住要在每段结尾打上一个工整的小结蝴蝶结,开头往往是“总而言之”。这就像是文字版的深度伪造:一眼扫过去看起来没问题,但一旦你开始寻找那些“人类才有的”不完美,整件事就露馅了。
判断一段文字是否由AI生成,有几个常见方法。首先,你作业提示中的关键词会被反复使用。其次,由于AI聊天机器人会产生幻觉,内容里会包含不准确的事实。第三,句子读起来不自然。第四,解释泛泛而谈、重复啰嗦,实际上没有推进任何论点。第五,语气听起来不像作者平时的写作风格。举个例子,一个学生可能会用ChatGPT来写一篇短作文:直接把题目复制粘贴进工具,让这个依赖大语言模型和对话问答格式的聊天机器人生成结果。
拿这个提示来说:“请用300词以内,解释这次SWOT和品牌审计将如何为你的最终提案提供参考。”ChatGPT给出的结果是:“我收到了这样的回答,或者跟它高度相似的回答,在我当老师的这些年来遇到过好几次。最明显的警示信号之一,就是最终产物中出现了大量提示词里的关键术语。学生一般不会用这种方式在自己的作业里重复提示中的关键术语,而这种结果读起来更像是……”这种机械复制提示词的做法,恰恰暴露了AI写作缺乏人类处理信息时的转化和消化过程。
热门跟贴