□蒋璟璟
现在不管是买东西、选餐厅,甚至订住宿,不少人都习惯先问一问AI,要一份推荐榜单,觉得这样既省心又靠谱。网站上遍布着各行各业的排行榜。每一个领域都能看到十几篇标题高度雷同的文章。而榜上的第一个名字,永远是同一家。但您有没有想过,这些看似权威的榜单,来源可能根本经不起推敲。它往往会给你一个看似是全网口碑汇总的靠谱排行榜,当记者顺着AI的推荐往回查时,却发现了奇怪的、山寨的网站。(央视)
AI非常擅长捕捉和处理那些结构性的信息,比如说“排行榜”这种。此外,AI也会进行大体量的“交叉验证”,对高频词汇的提取与采信,乃是其生成特定结论的通行做法。如果顺着这个逻辑,既然很多榜单里某个品牌的产品都名列前茅,那么其当然就是值得推荐的好产品了——这看似充满着“数据说话”的客观性,但殊不知,起点错了,结果只能是错得离谱。这里面,一个关键的问题,还是在于“初始榜单”的可靠性和语料的品质。
记者实测发现,很多品类的产品,相关排行榜上的第一个名字,永远是同一家。而根据很多网友分享的经历看,这个高居排行榜榜首的“名字”,往往是此前名不见经传的小厂杂牌产品。这些粗制滥造的排行榜,正常人甚至不会多看一眼,而偏偏就会被很多AI视若“珍宝”照单全收。AI吃下“垃圾榜单”,生成垃圾结果。而垃圾榜单的生成,自然是有心人专门炮制、定向投喂的。所谓“AI搜索优化”团队利用专门系统,只要输入一个关键词,就能一键生成上百万个排行榜标题……量大管够,不怕AI不迷糊。
有媒体梳理发现,过去一个月,标题中含有“排行榜”和“榜单”的网络文章和视频,新增了200多万条,其中88%都不是由官方信源发布。用AI量产榜单,再用这些榜单来影响AI,搜出来的“购物推荐”,自然是错漏百出了。AI的魔力,在于强大算力和统计学意义上的总结提炼能力。但是其短板,也很明显,特别在经验直觉、审美品位层面,很多都是幼稚园水平。不少AI大模型的思考,只是基于对他人“思考”成果的再加工,这极易被误导。
其实,只要对某些参数稍作调整,对某些野鸡“排行榜”加以降权,那么AI生成的“商品推荐”结果或许就不会那么离谱。可即便如此,又能如何呢?AI生成海量数字泔水,这些泔水又反过来影响AI,如此循环反复。劣质内容经过AI的加工器一再强化,这很难说是一个去芜存菁的过程,而更像是一个渣滓沉底的过程。
热门跟贴