打开网易新闻 查看精彩图片

时间序列数据有多种形式和潜在应用场景,这意味着没有单一的预测方法能够在所有情况下都表现最佳。

如果你要预测明天的最高和最低温度,或者一家公司是否能达到下周的销售目标,点预测是个不错的选择。但如果你要决定何时补充产品库存或评估公司的风险敞口,概率预测可能更有用。其他时候,你可能需要在实时数据流中检测异常,以防止网络中断或机器故障,这时速度至关重要。

IBM研究院构建了一系列在各种场景下表现出色的时间序列基础模型。这些模型于本周发布,目前在Hugging Face的GIFT-Eval排行榜上名列前茅:FlowState-r1.1用于点预测(在零样本、可复现、无数据泄漏的模型中),PatchTST-FM-r1用于概率预测(在可复现、非智能体、无数据泄漏的模型中),以及TTM-r3和TSPulse-r1用于高效预测、异常检测、分类和搜索,支持每秒数千次推理。

这些模型基于不同的架构构建,各有自己的优势。本文将详细介绍这些新功能、每个模型最适合的任务类型,以及如何访问和使用它们。

PatchTST-FM-r1模型特性

我们最新的基于Transformer的模型PatchTST-FM-r1与伦斯勒理工学院联合开发,基于我们开创性的PatchTST架构演进而来,该架构引入了通道独立性和分块技术,实现更准确、更高效的预测。PatchTST-FM-r1模型在预测任务中表现出色。它支持128到8,192个时间点的上下文长度,能够在短期和长期时间范围内进行预测,并且对缺失值具有鲁棒性。其目前的GIFT-Eval排名证明,在由真实和合成数据组成的大规模数据集上训练时,Transformer架构可以灵活、富有表现力且具有高精度性能。

TTM-r3高效性能

TTM-r3是我们TinyTimeMixer模型的第三代版本,旨在平衡速度和准确性。该版本引入了多项创新,提高了预测精度,推理速度比当前最先进的模型快15到50倍。TTM-r3在仅CPU环境中也能出色运行,使其非常适合真实世界的高吞吐量部署。TTM-r3支持快速微调、多变量预测,甚至可以整合控制变量,在复杂的工业场景中提升性能。我们的TTM模型极受欢迎,在Hugging Face上的下载量已超过3700万次。

FlowState-r1.1创新架构

FlowState-r1.1是我们FlowState模型的最新版本,基于名为S5的新颖状态空间架构构建,能够处理短期和长期输入以及预测时间范围,还支持不同的采样率。通过结合状态空间模型编码器和函数基础解码器,FlowState-r1.1具有协调不同采样率数据以产生准确长期预测的罕见能力。这个新版本整合了额外的合成训练数据,并增加了上下文长度以进一步提升性能。

模型应用场景

所有三个模型版本都扩展了IBM的时间序列模型产品组合,并与TSPulse互补。TSPulse是我们在异常检测、搜索、分类和插值任务中表现出色的紧凑型预训练模型系列。

这些模型共同覆盖了广泛的真实企业需求。应用场景包括工业制造和监控,以及检测IT事件和电网中断。这些模型总共在超过1000亿个来自公共领域或人工生成的数据点上进行了训练。

根据应用场景,每个模型都有其关键优势。对于CPU机器上的高吞吐量和低延迟需求,可以尝试TTM-r3。对于准确的点预测和概率预测,可以分别尝试FlowState-r1.1和PatchTST-FM-r1。对于时间序列异常检测、分类和其他非预测任务,可以尝试TSPulse。

技术发展历程

自2021年发布TST以来,IBM一直引领着时间序列基础模型的研究和开发,TST是最早应用于时间序列数据的基于Transformer的模型之一。2023年,PatchTST为时间序列数据引入了分块和通道独立性概念,使Transformer能够高效处理长时间序列。同年,TSMixer通过使用多层感知机(MLP)结合分块和跨通道信息,在提高速度和效率方面开辟了道路。

在混合器的基础上,2024年发布的Tiny Time Mixer(TTM)引入了首批跨多个领域任务的轻量级时间序列模型。2025年,基于状态空间模型(SSM)这种高效的循环神经网络类型,我们推出了FlowState时间序列模型。其创新包括并行训练、函数基础解码和采样率不变性。TTM和FlowState的早期版本在2024年和2025年的GIFT-Eval预测排行榜上表现优异。

今年,我们通过发布PatchTST-FM-r1、TTM-r3和FlowState-r1.1完善了产品组合,这些模型再次在GIFT-Eval预测排行榜上名列前茅。它们与专门从事异常检测和分类的TSPulse相辅相成,共同覆盖了广泛的真实使用场景。

模型获取方式

我们所有的模型都是开放权重的,可以在Hugging Face上下载。研究版本在非商业许可下提供,而我们的Granite时间序列模型系列在精选数据集上训练,在宽松的Apache 2.0许可下提供。

为了帮助用户开始使用IBM的时间序列模型,我们提供了多个笔记本。这些笔记本突出展示了每个模型的功能和最佳用例,基于我们开源存储库的模型架构和支持代码构建,涵盖FlowState、TTM、PatchTST-FM以及TSPulse异常检测和分类等内容。

Q&A

Q1:IBM发布的时间序列模型有哪些,各自适用什么场景?

A:IBM发布了四个主要模型:FlowState-r1.1适用于点预测,PatchTST-FM-r1适用于概率预测,TTM-r3适用于高吞吐量和低延迟的CPU环境,TSPulse适用于异常检测、分类和搜索任务。这些模型共同覆盖了工业制造监控、IT事件检测、电网中断预警等企业级应用场景。

Q2:TTM-r3相比其他模型有什么优势?

A:TTM-r3是第三代TinyTimeMixer模型,主要优势是速度快,推理速度比当前最先进模型快15到50倍,在仅CPU环境中也能出色运行,非常适合高吞吐量部署。它支持快速微调、多变量预测,还可以整合控制变量,在复杂工业场景中表现优异,在Hugging Face上下载量已超过3700万次。

Q3:如何获取和使用IBM的时间序列模型?

A:所有模型都在Hugging Face平台开放下载,研究版本采用非商业许可,Granite系列采用Apache 2.0许可。IBM提供了多个使用笔记本,包括FlowState、TTM、PatchTST-FM和TSPulse的使用指南,这些笔记本基于开源存储库构建,详细展示了每个模型的功能和最佳用例。