中经记者 索寒雪 北京报道
近日,《中国经营报》记者从中国知网内部人士处获悉,知网将推出大模型产品。高校教师、科研人员及学生在梳理并输入核心想法后,该产品可基于知网高质量数据资源,辅助开展文献检索、选题分析和结论推断等工作。
当记者询问该服务未来定价时,上述人士表示:“新产品不代表定价一定更高。作为企业,我们只收取合理利润。”
高质量语料降低“幻觉”
知网是国内知名学术文献数据库,也拥有被广泛使用的学术不端文献检测系统。
对于高校毕业生和科研工作者而言,论文查重是论文写作和发表的重要环节。通过比对文本与已发表文献、网络资源及既有论文,查重系统能够识别重复或未规范引用的内容,从而遏制抄袭、剽窃等违背学术规范的行为。大学毕业论文以及在期刊发表的学术论文,通常都需要经过查重环节。
上述知网人士对其大模型产品表达了信心。“我们的数据精度非常高。每一篇在知网上发布的文章,都要经过严格审核。我们的大模型和普通检索不一样。”他说。
该人士解释称,知网大模型依靠概率推理实现相关功能,而推理能力需要依托海量数据训练。与部分模型抓取网络多渠道零散数据不同,知网的训练语料主要来自期刊编辑部、报社、学术会议等渠道,以付费形式获得原版内容,语料来源相对稳定,精准度较高。
对于该模型的用途,上述人士介绍,用户不仅可以通过模型查找论文选题,也可以借助模型辅助生成文章。用户只需梳理核心构思,不必把大量时间耗费在重复性的文字编撰上,而是可以把更多精力放在抓取行业关键点、新闻点以及输出自身观点上。
此外,该人士表示,学生完成论文后通常需要进行学术查重,未来查重工具也可以嵌入知网大模型产品中。“我们整体上是在搭建一站式科研服务平台,把人从重复性、低附加值劳动中解放出来,让用户更多聚焦观点构思等创造性工作。”他说。
还用动手做实验吗?
据了解,知网大模型产品主要面向科研工作者、高校教师和学者,作为学术科研助手使用。此外,学生也可以用其查阅、调阅文献,辅助确定论文选题。
上述人士表示:“我们资源库中的学术文章每天都会更新,期刊最新发表的前沿文章也会在库中动态更新,用户可以随时查看。不管是学者还是学生,做论文选题时面对海量资料,都可以依托我们的人工智能助手开展工作。”
谈及用户画像时,该人士解释称,知网传统核心用户是高校师生,主要用于论文写作和学术研究;如今,产品覆盖面正在持续拓宽,各行各业科研从业者、企业研发人员、新闻媒体从业者都可以使用。
他表示,各类文献是知识与信息的重要载体。依托全行业文献资源,知网还可以搭建细分领域专项大模型。例如,围绕农业生产场景,搭建农资大模型,提炼农作物种植、病虫害防治等相关知识,落地后可用于指导农户开展果树栽种和病虫害防治。
未来,与实验相关的数据是否仍需研究者实地采集?
对此,上述人士表示:“实验数据肯定要研究者自行实操获取。不过,当前AI for science也在落地发展,可以依托细分领域研究数据开展科研探索。AI具备自主学习能力,科研人员划定研究方向后,AI甚至能够自主挖掘新的研究方向,运算效率远超人类。比如新药研发,人工筛选分子组合可能耗时两年,AI短短几天就能完成全部组合测算,后续再由科研人员筛选验证即可。”
此前,有业界人士指出,该大模型并非替代科研人员完成全部研究过程,而是在文献整理、方向筛选、数据分析和结论推演等环节提升效率。对于高校师生和科研人员而言,如何在提高效率的同时守住学术规范边界,也将成为此类产品落地后必须面对的问题。
(编辑:郝成 审核:朱紫云 校对:陈丽)
热门跟贴