帝国战争博物馆(IWM)、凯捷(Capgemini)和谷歌云宣布了一项具有里程碑意义的合作,成功完成了20000多小时的IWM口述历史收藏的人工智能转录和翻译。这个变革性的项目利用先进的生成式人工智能(GenAI)对档案进行转录、翻译和交互式探索。将使全球公众、研究人员和教育工作者能够轻松获取20世纪冲突的宝贵第一手资料。

这是英国博物馆首次使用这种规模的人工智能转录技术来创建可供用户搜索、探索和使用录音的资源。IWM计划在今年晚些时候通过其网站向公众发布这项新技术。一个新的平台将补充现有的记录和资源,用户可以在其中搜索超过200万个收藏项目的记录。

从1945年到2000年代,IWM口述历史的很大一部分——包括对服役人员的大约8000次采访——以前只能以音频文件的形式提供。这使得访问它们成为一个耗时的过程。这些记录捕捉了独特的冲突经历,带来了额外的挑战,包括记录时的各种表达、专门的军事术语和不同的音频质量。

凯捷与谷歌云合作开发了一种创新的解决方案,使这些录音成为IWM更广泛的口述历史收藏的一部分。该项目使用了一个建立在谷歌云上的复杂管道,采用谷歌的Gemini模型进行转录和分析。除了基本的转录外,该系统还提取元数据,如人员、地点和军事单位的名称,并生成全面的访谈书面摘要,突出记录中的关键事件和主题。这一过程如果靠人工估计需要22年的时间,但通过AI只需要几周的时间。这将大大提高用户访问和搜索这一广泛的口述历史收藏的能力,快速找到他们想要的材料,并在书面记录和原始录音之间轻松选择。

帝国战争博物馆数字参与和转型总监Nick Hodder说:“这个项目是我们扩大对大量藏品的访问的使命向前迈出的一大步。”“我们的专业策展人全面参与了这项工作,确保该技术具有很高的准确性,包括理解和解释口音、历史事实和军事术语。IWM、凯捷和谷歌云之间的这一里程碑式的合作是一项重大创新,也是英国博物馆的首次合作。”

该技术在转录测试中取得了令人印象深刻的结果,单词准确率为99%,说话者日记化率为94%(根据说话者的身份对音频进行分区)。该应用程序允许用户使用自由文本搜索简介,收听同步转录的录音,并通过易于使用的界面访问人工智能生成的书面摘要。突破性的“提问”功能使用户能够就任何采访提出自然语言问题,直接从内容中获得答案,并附有引用,确保准确性并促进广泛的研究需求。

凯捷英国首席技术与创新官Steven Webb表示:“我们非常自豪能与帝国战争博物馆和谷歌云合作,共同推进这一具有文化意义的倡议。”“这个项目展示了生成式人工智能在解锁历史档案并以新的、引人入胜的方式使其可访问方面的深远影响。这证明了技术如何将我们与过去更深入地联系起来,为我们的未来提供信息。”

Google Cloud首席技术官办公室董事总经理John Abel补充道:“Google Cloud致力于为帝国战争博物馆等组织提供人工智能工具,这些工具可以改变我们与历史的互动方式。使用Gemini模型来处理和理解如此庞大而微妙的音频收藏,展示了生成人工智能克服复杂挑战并取得有意义成果的复杂能力。”

IWM计划在未来扩展其人工智能能力,将人工智能分析与人类专业知识相结合,以显著提高广大潜在用户访问和参与其部分收藏的能力,包括研究人员、学者和更广泛的普通公众。这项技术还为博物馆提供了支持,创造了新的方式来解释以前没有的强大的冲突故事。

潜在用途的案例研究

IWM的声音档案是历史学家的宝贵信息来源,他们希望更多地了解亲属的战争经历。通过搜索新平台,可以很容易地找到与亲属有相似经历的人的第一人称内容。这些口述历史可以作为书面记录和原始录音提供,与任何官方记录相比,它们将为用户对亲属经历的理解增添更多的活力和深度。新平台将补充IWM现有的在线资源,包括在线收藏、第一次世界大战生活和战争纪念登记册。

长期以来,IWM的音频采访一直是任何想要了解更多战争经历现实的人的丰富资源。虽然这些长期以来一直可以在IWM的网站上作为音频文件收听,但没有书面记录,因此聋人或其他依赖书面材料的人无法访问。通过可搜索的人工智能生成的文本版本,这一宝贵的历史证词现在将具有更高的可访问性。

研究人员在纪录片、播客、杂志文章和书籍中寻找口述历史证词的例子,会发现更容易找到他们想要的信息。以前,这需要从头到尾听几个小时的录音来发现感兴趣的相关片段。现在,一个简单的关键字搜索将使研究人员直接找到相关的音频和文本记录,然后这些记录将以书面和音频格式用于商业许可。

学术研究人员寻找第一手资料来为书籍、论文和文章提供说明和信息,他们会发现寻找有用和相关的材料要简单得多。通过使用AI聊天功能询问诸如访问广岛后的感受等问题?或者你是如何庆祝战争结束的?在特定的转录中,它们将很快被引用到最相关的部分,使研究比以前更快、更有成效。IWM的声音档案是世界上最大、最受尊敬的原始资料库之一,因此通过尖端人工智能技术增加访问量将对学术界大有裨益。

关于帝国战争博物馆

IWM(帝国战争博物馆)保存自第一次世界大战以来,在涉及英国和英联邦的冲突中生活、战斗和死亡的人们的故事。由日常和特殊内容组成,揭示了人们、地方、想法和事件的故事。鼓励人们从不同的角度看待冲突,丰富他们对战争的原因、过程和后果及其对人们生活的影响的理解。

IWM的五个分馆每年吸引超过200万游客,分别是IWM伦敦分馆,这是IWM的旗舰分馆,最近改造了新的、永久的、免费的第二次世界大战和大屠杀画廊;IWM North,位于Daniel Libeskind设计的标志性获奖建筑内;IWM Duxford,英国保存最完好的战时机场;丘吉尔作战室,位于白厅下面的丘吉尔秘密总部;第二次世界大战巡洋舰贝尔法斯特号。

关于凯捷

凯捷是一家全球商业和技术转型合作伙伴,帮助企业加速向数字化和可持续发展世界的双重转型,同时为企业和社会创造切实的影响。它是一个由50多个国家的34万名团队成员组成的负责任和多元化的团队。

凭借其55年的悠久历史,凯捷深受客户信赖,能够释放技术的价值,满足他们的全部业务需求。它利用从战略和设计到工程的优势提供端到端的服务和解决方案,所有这些都得益于其在人工智能、生成人工智能、云和数据方面的市场领先能力,以及其深厚的行业专业知识和合作伙伴生态系统。该集团报告2024年全球收入为221亿欧元。

关于谷歌云

Google Cloud是一种新的云计算方式,提供人工智能、基础设施、开发人员、数据、安全和协作工具。谷歌云提供了一个强大、完全集成和优化的人工智能堆栈,拥有自己的全球级基础设施、定制芯片、生成式人工智能模型和开发平台,以及人工智能驱动的应用程序,以帮助组织转型。200多个国家和地区的客户正在使用谷歌云。

NVIDIA DLI 与 Ai 时代前沿合作,将大门向更多普通用户敞开!无论你是对新技术充满好奇心的爱好者,还是希望提升自己技能的职场人士,这里都有适合你的课程和资源。