KoCoNovel由首尔国立大学的研究团队创建,旨在为韩国文学作品中的字符共指解析提供丰富的数据支持。该数据集包含了50部小说中的178K个Token,是继NIKL语料库之后的第二大公共共指解析语料库,并且是第一个基于文学作品的共指数据集。KoCoNovel的独特之处在于,其24%的角色提及为单个普通名词,没有修饰语,这一特征深受韩国称谓文化的影响,该文化倾向于使用表示社会关系和亲属关系的术语而非个人姓名。数据集提供了四种不同版本,从全知视角和读者视角进行注释,以及将多个实体作为独立或重叠实体处理。KoCoNovel的发布,不仅填补了韩国文学作品共指数据集的空白,也为自然语言处理领域的研究者提供了宝贵的资源。

详情请参见五号雷达:https://www.5radar.com/result?key=KoCoNovel

打开网易新闻 查看精彩图片