大规模语言模型(Large Language Models,LLM),也称大规模语言模型或大型语言模型,是一种由包含数百亿以上参数的深度神经网络构建的语言模型。自ChatGPT发布后,迅速引起了全世界的广泛关注。用户可以使用自然语言与系统交互,从而实现包括问答、分类、摘要、翻译、聊天等从理解到生成的各种任务。近来,专家学者对大语言模型在文博行业的应用场景也进行了各种设想。

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

百达文化科技有限公司率先在设计布展河姆渡遗址博物馆时积极做出尝试。我们利用浙江理工大学的语言模型库,整理分析了大量河姆渡相关资料,生成的数字人模型在展览中引起了不小的轰动,饱受好评。

打开网易新闻 查看精彩图片

此外,世界各地的博物馆和艺术机构也已开启了各种尝试。他们认为大语言模型可以应用于观众咨询、知识生成、导览讲解、展览策划、藏品管理、文创开发、科学研究、观众分析等领域。

信息提取与总结

美国自然历史博物馆正在尝试使用自然语言处理技术,来处理观众评价中的非结构性文本数据,从中提取有价值的信息和见解。他们使用IBM Watson人工智能计算机系统通过大量定性和定量数据识别和分析概念、分类、关系、情感和态度。同样地,他们还使用谷歌(Google)的云自然语言处理应用,来分析观众的留言,并得出相应的情感分析评分。

美国自然历史博物馆
打开网易新闻 查看精彩图片
美国自然历史博物馆
《天使报喜》——经过人工智能系统识别画中的对象
打开网易新闻 查看精彩图片
《天使报喜》——经过人工智能系统识别画中的对象

2023年底,普拉多美术馆与巴塞罗那超级计算中心合作推出了一个人工智能项目,项目中的一个分支就是通过一个自然语言理解器,分析绘画中的字符和概念,再经过语言模型的改写,生成更具情景化的描述语言,通过改写的藏品信息可适用分众化的人群和场景,为观众提供更好的阅读体验。

信息生成

2023年9月,那舍尔艺术博物馆推出了名为“表现得像是一名策展人:一个人工智能生成的展览”。该展览是第一个严格意义上的、从展览标题到展览主线,从展品选择到展品描述,全流程都是由大语言模型生成的展览。策展人先与ChatGPT对话,确定了展览主题,策展人想方设法将馆藏14000件藏品“投喂”给了ChatGPT,让它在此基础上挑选展品并撰写展品描述。

那舍尔艺术博物馆
打开网易新闻 查看精彩图片
那舍尔艺术博物馆

据报道,2024年下半年,英国纽卡斯尔的探索博物馆将在线上线下同步发布其为期三年的人工智能项目“全等机器”的成果。该项目的初衷是为了充分利用未向公众展示的大部分藏品,用计算和人工智能技术,链接之前未被关联起来的不同载体、形式、门类的藏品。探索博物馆将这种结合智能技术与人为阐释,将藏品以一定逻辑关联起来的方式称作一种“新型叙事”。

多模态能力

美国达利博物馆在去年推出了一个生成梦境的展项,这个展项利用大语言模型由文字生成图像的技术DALL-E,邀请观众们用文字描述他们的梦境,再将这些梦境拼贴结合在一起,生成达利风格的拼贴画。馆方认为根据梦境描述由人工智能生成的图像,例如“云中的鲸鱼”“飞翔的猫咪”或“在电梯中漂浮”,与达利作品中的某些超现实元素不谋而合。这种“朋友与亲人合作通过构想梦境来构建未来”的形式,备受欢迎。截止目前,这个展项已经收集了超过35000个梦境,并将它们都转变为了数字艺术创作。

达利博物馆
打开网易新闻 查看精彩图片
达利博物馆

现阶段,大语言模型技术已逐步用于展览策划、新闻稿编写、观众分析、展品生成以及导览内容生成等方面。当然,这些前沿实践在文博领域也充分显示出,当前阶段的人工智能内容生成仍然需要大量人工介入和监督。

大语言模型在文博领域的运用,又面临哪些挑战呢,我们下期再见!