VAST Data在过去一年中成为世界上最热门的科技公司之一。这家以闪存阵列开发商起家的公司,已经发展成为软件定义基础设施的全栈提供商,可以在任何地方运行人工智能。随着GenAI工作负载在2024年投入生产,VAST似乎准备与Databricks和Snowflake等公司竞争,以夺取其工作负载份额。
VAST Data由Renen Hallak、Shachar Fienblit和Jeff Denwork于2016年创立,这三位技术高手分别来自戴尔EMC、Kaminario和CTERA Networks。该公司的大目标是重新思考分布式系统架构存储,并重新开发一个名为DASE的存储平台,DASE代表“分解和共享一切”(DisAggregated and Shared Everything)。
2019年,它推出了一种称为通用存储的横向扩展非结构化存储产品,迈出了实现DASE目标的第一步。使用QLC NVMe驱动器和Optane Xpoint元数据的VAST Data,声称已经实现了提供单个存储层的功能,拥有磁带的成本效益和RAM的速度,而不是将数据分层存储。
2021年,VAST开始采用订阅销售模式出售其存储硬件,将硬件变成了软件服务。去年8月,该公司推出了VAST数据平台,扩大了其基础设施覆盖范围,该平台采用全栈方法为人工智能提供数据存储和计算功能
VAST数据平台由四部分组成,包括DataStore(通用存储);DataBase提供数据库、数据仓库和数据湖功能;DataSpace,一个用于存储、检索和处理数据的全局命名空间;DataEngine是一款无服务器计算引擎(类似于Amazon Lambda),预计将于今年晚些时候发布。
该公司表示,虽然目前的大数据系统主要侧重于在单站点CPU系统上以批处理模式处理太字节(TB)规模的结构化和半结构化数据,但未来的人工智能工作负载将主要在全球联合GPU和DPU上实时处理太字节(TB)到艾字节(EB)规模的非结构化数据。
该公司在其白皮书《深度学习数据平台的崛起》中表示:“VAST数据平台的目标是弥合这一鸿沟,为客户提供当今数据平台的简单体验,同时也满足深度学习应用程序的需求,这些应用程序的数据类型、数据规模和数据位置远远超出了当今商业报告系统的界限。”
“通过构建一个可以存储和组织艾字节(EB)数据的架构,并在全球分布的一组人工智能超级计算机上调度计算功能,该平台目标指向了一个超越我们今天在大型语言模型中使用的相对基本的生成式人工智能形式的未来。”
它还没有交付数据引擎,这是其数据平台的关键部分,但无论如何,客户都在排队。皮克斯(Pixar)、Zoom和Verizon等公司以及美国国家航空航天局(NASA)、美国空军(U.S. Air Force)和美国能源部(U.S. Department of Energy)等政府机构都已成为付费客户。
据首席执行官Hallak介绍,VAST Data在2023年初超过了1亿美元的年度经常性收入(ARR),并继续保持增长,到8月底达到2亿美元,累计预订量超过了10亿美元。去年12月初,在富达(Fidelity)领投的E轮融资中,VAST Data获得1.18亿美元融资,当时该公司的估值已经达到91亿美元。
Hallak去年12月对《华尔街日报》表示,该公司过去12个季度的现金流一直为正,而且在过去三轮融资中没有使用任何融资现金。他对《华尔街日报》表示:“我们打算保持这种指数级增长。”
Hallak称目前的发展战略还要求在某个不确定的时间点进行IPO。他说:“我们现在把公司当作上市公司来经营。”
合作将是帮助这家总部位于纽约的软件公司实现其巨大梦想的关键。该公司已经建立了合作平台提供商,其中包括与惠普企业的合作伙伴,后者将VAST纳入其HPE GreenLake产品。它还与Genesis Cloud和英伟达(Nvidia)建立了合作关系。
近期它宣布与Run:AI合作,提供全栈人工智能解决方案。Run:AI的软件位于AI工作负载和底层计算资源之间。它为AI工作负载自动分配GPU,降低计算资源浪费,同时提供对环境的全面监控。
Hallak在新闻稿中表示:“我们与Run:ai的合作超越了传统的、不同的人工智能解决方案,整合了高效人工智能管道所需的所有组件。”“今天的公告为全球数据密集型组织提供了蓝图,以实现更高效、更有效和更创新的人工智能运营。”
随着数据量和人工智能计算需求的增长,需求与现有系统架构之间的不匹配是不可避免的。VAST Data声称有一种彻底的新方法来解决这一差距,时间会证明它是否正确。
热门跟贴