核能正在崛起,以满足美国对能源的需求。但建造新的反应堆,甚至更新现有反应堆的许可证,都需要大量的文书工作。幸好人工智能也在崛起,文书工作是它最擅长的事情之一。
一个创新的新人工智能项目中,科技初创公司Atomic Canyon(原子峡谷)及其合作伙伴Diablo Canyon(加利福尼亚州唯一一家运营的核电站)使用能源部橡树岭国家实验室(ORNL)的Frontier超级计算机,根据核工业的独特需求开发了新的人工智能模型。
人工智能模型旨在减少核工业在搜索与零件、维护记录、工程评估、法规和工厂程序相关的数百万份复杂核文件上花费的时间、劳动力和资源。人工智能模型是开源的,核工业中的任何人都可以使用。一旦完全开发,人工智能模型可以在美国各地的工厂中使用。
Atomic Canyon的创始人兼首席执行官Trey Lauderdale表示:“我们需要能源,核能是实现我们今天拥有的能源和为未来建设能源的绝对关键组成部分。”
核工业由核管理委员会(NRC)监督,以确保核设施安全高效运行。美国核管理委员会的主要职责包括监督许可和建设、评估反应堆设计、监测环境影响以及审查关闭反应堆的退役计划。
Diablo Canyon由太平洋天然气和电力公司(PG&E)拥有和运营,为加利福尼亚州400多万人供电。它提供了该州总能源的8%左右。
经过几十年的运营,Diablo峡谷原定于2025年退役,但在2022年,由于认识到加利福尼亚州对能源的需求不断增长,州领导人改变了主意,决定将运营延长到2030年。
Diablo Canyon副总裁Maureen Zawalick表示:“这意味着我们必须重新启动很多事情,包括向NRC提交一份约3000页的大规模申请。”“所以,我们以一种非常压缩的方式做事——浏览成千上万的文件、记录和信息,以满足所有要求。”
Diablo Canyon负责人工智能项目的总监Jordan Tyman解释说,提交许可证变更是一个极其复杂的过程,在编写过程开始之前,可能需要几天或几周的时间来筛选文档和行业指南。
Tyman说:“搜索我们为Diablo峡谷授权50年来积累的大量记录非常耗时。”“有一种方法可以整合从以前提交的文件中吸取的所有经验教训,并快速找到所有相关文件来支持工程师易于理解的许可证修订,这将为我们的员工消除一个很大的负担。”
Zawalick说,估计员工每年可能要花大约15000个小时来搜索文件。Diablo峡谷的数据库包含约20亿页的文档,需要大量的机构知识来导航。她指出了最近的一个例子,在这个例子中,一个阀门的问题引发了为期6个月的调查,导致员工无法履行正常职责。Diablo峡谷核创新主管Erin Bowe说:“这是181个工作日。”
Bowe说:“我们需要的是一个自然语言搜索工具,比如让谷歌查找一个特定的组件,但不必知道一个特殊的数字或特殊的指标。”“我们想要一个可以用来说‘找到X阀’的工具,它将为我们提供该部件的整个历史以及我们试图解决的问题的所有相关信息。”
人工智能有可能缓解许多这些必要但劳动密集型的要求,同时确保更准确的结果。
Lauderdale说:“然而,你不能只使用任何消费者人工智能模型,因为在核工业中,精度和可靠性至关重要。你必须找到正确的文件和记录。你必须准确地做事情,而且必须反复做。”
该团队尝试使用现成的人工智能工具,但每次他们测试商业人工智能模型来搜索特定的核文件并提供上下文时,这些模型都不可避免地难以正确使用核术语。Lauderdale说,这是因为他们不熟悉高度具体的核术语。在某些情况下,商业人工智能模型会出现幻觉,即人工智能产生虚假或误导性信息的情况。
为了解决这个问题,Atomic Canyon团队决定从头开始构建自己的AI模型。但是训练人工智能模型需要大量的计算能力和GPU的使用,而不仅仅是一个GPU,而是很多GPU。GPU使训练复杂的AI模型更快,因为它们擅长计算具有数百万或数十亿个不同参数的大量数据。
Lauderdale说:“为了确保准确性并减少幻觉,我们需要大量的数据以及多次运行数据的能力来正确训练人工智能模型。”“为了开始构建可靠工作的人工智能,我们需要一台超级计算机。”
“ORNL是核工程、人工智能和高性能计算领域的世界领先者,我们与美国核管理委员会在验证性分析和许可流程方面合作了50多年。我们还拥有并开发了美国核管理委使用的建模和仿真工具,”ORNL研究员Tom Evans说,他专门从事使用高性能计算(HPC)开发核相关应用的方法。
Evans说:“与原子峡谷的合作使我们能够应对国家创造新的人工智能工具的迫切需要,这将大大改善核许可程序。”
通过橡树岭领导力计算设施(OLCF)主任的自由裁量权分配计划,Atomic Canyon在Frontier超级计算机上获得了20000个GPU小时的奖励,这是世界上第一台百亿亿次级计算机,拥有37000多个AMD Instinct MI250X GPU。
该团队使用Frontier帮助开发了Atomic Canyon的Neutron平台,这是一种先进的人工智能解决方案,可以准确地搜索和理解各种复杂的核数据,从扫描文件和手写笔记到技术报告和操作历史。
Atomic Canyon还部署了Neutron Enterprise(企业版),这是Neutron的一个版本,运行在公司防火墙后面,提供最高级别的网络安全和出口管制协议,以确保业务敏感数据的安全。
Neutron平台基于句子嵌入模型,这是一种为单词分配数值的特定类型的AI。这种方法使模型不仅能够理解核专用术语和缩写的含义,而且能够理解它们在技术程序和监管指南中的上下文。
句子嵌入模型——绰号FERMI模型——是用NRC的全机构文档访问和管理系统(ADAMS)训练的,该系统包含300多万份文档。ADAMS是美国核管理委员会的官方记录数据库,包括大约5300万页的数字信息,详细介绍了自1980年以来美国每个核反应堆的历史。Neutron的AI智能搜索功能将帮助用户在ADAMS数据库和他们自己的本地文档和记录数据库中快速查找信息。
Frontier的数字处理能力对于反复运行数据是必要的,这样FERMI模型就可以根据用户的查询识别并快速检索相关信息。
Atomic Canyon工程负责人Richard Klafter表示:“句子嵌入模型主要用于搜索和检索。它们用于检索内容,而不是生成内容,而生成内容正是LLM所做的。”“向LLM提供内容需要检索正确的内容。错误的内容会导致LLM产生幻觉。因此,我们的第一步是建立一个好的检索模型,这就是我们在Frontier上训练的句子嵌入模型。”
除了使他们能够从头开始训练核词汇模型外,Frontier的计算能力还使他们能够训练更长的上下文模型。
Klafter说:“我们希望将输入加倍,这样人工智能就可以一次处理更大的信息块,但这需要数倍的计算能力。”“通过让人工智能更好地理解较长的文档,我们可以将需要索引的数据量减少大约一半,这使得系统的运行速度提高了一倍。”
即使在项目的早期阶段,PG&E和Diablo峡谷的工作人员已经看到了令人印象深刻的成果。事实证明,Atomic Canyon的工具不仅能够快速搜索核电站自身的故障排除和解决记录,而且能够通过NRC ADAMS数据库快速搜索美国核工业的整个历史,这将改变游戏规则。
Tyman说:“现在我们有了这个基础搜索工具,它是在NRC ADAMS数据之后,基于Diablo Canyon文档构建的。”“接下来是我们如何将其整合并应用于其他流程,如开发程序、培训、进行评估——这些真正有助于我们的工程师专注于解决技术问题,摆脱行政任务。”
“我们已经看到,使用Frontier开发的新人工智能工具,某些领域的生产力有所提高,”Zawalick说。“就我们与Atomic Canyon和ORNL合作的时间而言,投资回报率非常高。”
Atomic Canyon计划更新和构建更多版本的FERMI模型。在ORNL,Evans和他的同事、高级研发研究员Matthew Jessee目前正在探索新的计算方法,通过将FERMI模型与生成LLM相结合,进一步推动该技术的发展。
与Ai时代前沿合作,将大门向更多普通用户敞开!免费课程限时领,还有好礼相送!无论你是对新技术充满好奇心的爱好者,还是希望提升自己技能的职场人士,这里都有适合你的课程和资源。文章留言或私信小编拉您入群!
热门跟贴