打开网易新闻 查看精彩图片

随着网络环境日益整合蜂窝网络、网络切片和云原生架构,网络测试变得愈发复杂。实验室和验证团队现在需要在多供应商、多域堆栈中工作,当故障发生时,解决问题可能需要多个领域专家并行协作。Spirent Communications公司(已于2025年10月被Keysight Technologies收购)正寻求通过其智能体AI解决方案Luma来解决这一挑战,该方案专门用于网络测试和保障。

Spirent产品管理副总裁Anil Kollipara表示:"当出现故障时,无论是手动测试还是自动化测试,预测故障、找到根本原因并提供修复方案——这仍然是整个流程中非常耗时费力的环节。这是一个老问题,但我们之前没有合适的解决方案来全面解决它。正因如此,我们推出了Luma。"

Luma构建在领域专用知识图谱、确定性规则引擎和多智能体架构之上。初始版本针对Landslide平台,这是Spirent的核心网络测试平台,主要被运营商、服务提供商和超大规模厂商用于预生产性能测试。计划是逐步将Luma扩展到整个Spirent产品组合。

Luma围绕三大功能支柱构建:知识、测试用例生成和根因分析。

知识支柱处理针对技术规范、呼叫流程、产品文档和合规要求的查询。测试用例生成支柱让工程师能够通过对话描述测试场景,并让Luma在Spirent的Landslide平台内进行配置。根因分析支柱处理测试运行中的日志、关键性能指标和数据包捕获文件,以识别故障点。

Luma通过混合专家AI架构执行这些工作流程。Kollipara说:"我们在架构中构建了多个专家智能体。"

例如,有一个智能体专门处理PCAP文件并理解其内容。另一个智能体专门理解输入产品的配置。还有一个智能体专门收集所有信息并确定根本原因的优先级。

Kollipara解释说:"我们有大约10到12个智能体,并且会继续增加更多,它们协同工作为客户提供或执行完整的工作流程,从收集PCAP、日志和KPI等信息开始,处理所有这些信息,解释结果,并找出根本原因。"

AI的一个关键担忧是大语言模型不具确定性,可能产生错误信息幻觉。事实证明,减少幻觉的方法是减少大语言模型的使用,至少对Spirent的用例来说是这样。

Kollipara说:"我们引入了第三方AI平台,尝试了不同的大语言模型,很快就意识到大语言模型只是解决方案的一部分,而不是全部。在Luma中,大语言模型的作用几乎只占整体的10%,主要用于处理自然语言。大部分领域知识都构建在这个RAG数据库中,也就是我们构建的知识图谱。"

在数据库层之上,Spirent添加了与协议栈行为相关的确定性规则集。

Kollipara说:"我们见过在用户级别发生问题的情况,某个KPI出错,任何机器学习都能发现存在某种偏差。但仅使用机器学习算法很难明确根本原因,因为这需要对领域的深入了解,了解这些从协议栈角度是如何堆叠的。构建这种规则集非常重要,这样你就能获得输出的确定性。"

该产品的核心驱动因素是现代网络领域的专业知识差距。Kollipara指出,电信专家可能不了解云原生,而云原生专家可能不了解电信。当故障跨越两个领域时,解决问题需要协调具有不同专业领域的团队。

Kollipara引用了一个来自测试试用的具体例子。一位客户提交了一个支持工单,该工单经过三层支持才到达研发部门。在日志收集、客户可用性和团队间交接之间,工单花了七周时间才解决。当Spirent将同一组文件输入Luma时,问题在短短两分钟内就得到了解决。

针对Landslide的Luma是更广泛推广的第一阶段。Spirent计划将该平台扩展到其测试和实验室自动化产品Velocity,以及实时网络服务保障平台VisionWorks。

Kollipara说:"该平台将在多个产品线和多个用例中得到利用,但关键是要在该领域进行训练。这不会是即插即用的。我们可以直接将Luma用于不同的数据集或用例,但该平台将被利用、训练并为特定工作流程进行完善。"

Q&A

Q1:Spirent Luma是什么?它能做什么?

A:Spirent Luma是一个智能体AI解决方案,专门用于网络测试和保障。它能够处理技术规范查询、自动生成测试用例配置,以及分析测试运行中的日志、性能指标和数据包捕获文件来快速识别故障根本原因,将原本需要数周的故障排查时间缩短到几分钟。

Q2:Luma如何减少AI幻觉问题?

A:Luma通过最小化大语言模型使用来减少幻觉。在其架构中,大语言模型只占约10%的作用,主要处理自然语言。大部分领域知识构建在知识图谱数据库中,并添加了与协议栈行为相关的确定性规则集,确保输出的准确性和可靠性。

Q3:Luma的多智能体架构是如何工作的?

A:Luma采用混合专家AI架构,拥有大约10到12个专业智能体。每个智能体都有特定专长:有的专门处理PCAP文件,有的专门理解产品配置,还有的专门收集信息并确定根本原因优先级。这些智能体协同工作,执行完整的故障诊断工作流程。