昨晚,刷到一篇题为大象新闻的评论员文章——《86岁作家杨本芬承认作品“摘抄”,共情但难逃“抄袭”定论》。读罢扼腕,虽然大象新闻近年来做了一系列深度稿件以及调查报道让人敬佩,但这篇评论员文章实在不敢恭维。
文中有这样一段文字:“知网早就能够检验论文文字的重复率,精确到每一句,也就是说,这项技术并没有多高科技。再加上现在AI普及,出版社完全可以借助科技的力量去查重,然后通知作家们“降重”,抄袭情节严重的直接拒绝出版,这样一来也不至于一些作家“晚节不保”。
这段文字看似理性、中立、客观,实际上暴露出评论员其实完全不懂图书出版、版权和查重技术,只是凭着自己的想象,凭着自己的一腔热血在写评论。
评论说:“知网早就能够检验论文文字的重复率,精确到每一句,也就是说,这项技术并没有多高科技。再加上现在AI普及,出版社完全可以借助科技的力量去查重,”这个观点根本站不住脚。
图书出版的查重和论文查重看似差不多但实际上完全不一样。知网之所以能做论文查重有一个很重要的前提是因为国内的论文大多数都会被知网、万维等网站收录相对集中,这些论文网站+一些由政府主导的公益属性的数据库+一些公开网站的爬虫,知网当然可以做查重。
但知网的查重也不是完美的。如果抄袭者抄袭的论文并没有被上述数据库收录,则知网的查重就会失效,抄袭者就会蒙混过关。
我们说回图书查重。国内目前出版的图书以数十亿计,我们且不论有多少公版,这数十亿的图书版权分散在大大小小可能上千的版权方手上(没具体算过,但国内光出版社就几百家了,在加上民营图书公司,上千家肯定有了),建设这样一个量级的数据中心需要多少钱?各位可以自己去查一查,这里就按下不表了。
我们来说另外一个问题。我想请问一下大象新闻以及大象新闻的这位评论员:数十亿的书籍(这里还没算每年新增),哪个出版社或者哪个公司有能力把这些版权弄到手,并放在一个数据库里,以供查重使用,光版权成本一项就有多大?
怎么这么复杂重大的事情,到了评论员笔下就成了轻飘飘的一句话?新闻评论的核心是理性、客观、专业,是基于事实与常识的发声,而非凭着主观想象肆意评判、妄下结论。
另外,我觉得比这篇评论更可怕的事情是:评论员在文章中所透露出来的对ai和技术的一种盲目和某种说不清的狂热,这何尝不是当前弥漫于整个社会的一种集体情绪,将ai视为万能神药,认为只要用上了ai就能解决所有问题。
技术的进步真的能带来社会的进步吗?技术的进步真的能惠及到更多的普通人吗……技术应该服务于人,而不是让人成为技术的奴隶。
最后想说,新闻评论应当有专业知敬畏……
热门跟贴