一年一度的2025世界人工智能大会,将中国科技圈带入AI时间。网易科技作为大会官方合作媒体之一,发布《Future Talk》系列特别策划,对话科技企业领袖、观察AI产业最前沿的创新实践。

本期节目独家对话元枢智汇CEO汤林鹏。他介绍,高质量的数据是大模型的核心驱动力,但现有的通用大模型在专业性、速度方面均有待提升,相关原始数据管理及调用工作存在难题,这是接下来AI赋能各行各业的重要突破口。

Future Talk专访|元枢智汇CEO汤林鹏:数据管理是AI赋能百业的突破口
打开网易新闻 查看更多视频
Future Talk专访|元枢智汇CEO汤林鹏:数据管理是AI赋能百业的突破口

他认为,元枢智汇开发打造的AI数据库及Data Flow框架正是为AI深度融入行业发展而来:它提供了一种底层模态数据处理的思路,为用户提供了低门槛调优大模型的方案。

谈及未来发展规划,汤林鹏坦言,希望把Data-centric AI的理念推向全球,把大模型和千行百业深度地结合。

以下为网易科技与元枢智汇CEO汤林鹏的对话实录(网易科技整理发布):

网易科技:元枢智汇是一家AI数据公司,请先简单介绍下元枢智汇和您自己

汤林鹏:我于2018年从美国普林斯顿大学博士毕业,长期从事非结构化数据集的处理研究。元枢智汇成立于2024年底,正是在大模型快速发展的背景下应运而生。我们观察到,从GPT1到GPT4,模型的架构的变化并不显著,但模型能力不断提升,其关键就在于数据质量、质量、处理合成的方式的演化。而DeepSeek R1的发布标志着人工智能发展进入了“下半场”。通用大模型实现了开源,在以互联网为主的任务上表现优异,吸引了广泛关注,也在一定程度上完成了市场教育。然而,我们认为下半场的发展重点将更多转向与具体行业的深度融合。我们重点关注工业、制造、AI for Science、医疗、金融等领域,在这些专业场景中,通用大模型往往面临专业性不足、时延过高、结果可靠性较低等问题。因此,将大模型与专业数据相结合,是提高其行业适应性的关键所在,这也将成为其与实体经济深度融合的重要路径。元枢智汇正致力于发展此类技术,为不同行业的企业提供切实可行的AI赋能方案。

网易科技:目前大模型的数据存在着哪些问题?元枢智汇是如何把数据进行统一管理和处理的?

汤林鹏:当前面临的挑战主要有两个方面:首先是数据规模的巨大性。从几百TB级别的文本数据,到PB级别的多模态数据(如结构化表格、文本、图像、视频、空间等),AI在诸如具身智能、低空经济、后数字地球等新兴领域的应用,使得数据量持续增长,且结构日益复杂。现有技术方案通常需要配置七八个不同的数据湖或专用数据库,效率低下,成本高昂。因此,我们从底层架构了自研的AI数据库。实现了对多模态异构数据的统一管理与高效查询,涵盖高维向量、文本、时间序列、空间等类型。其次是如何将原始数据转化为AI Ready的数据与智能体结合。这套Pipeline的研发门槛非常高,在千行百业存在数据工程层面的落地困难。针对以上问题,我们提出了DataFlow数据治理、数据准备的框架,帮助用户通过低门槛,甚至低代码拖拉拽的形式,将原始数据变成AI Ready的数据,从而调优自身专属的大模型和智能体。

网易科技:元枢智汇重点拓展的行业和领域有哪些?目前有哪些客户(工业、金融、医疗)?可否举个例子说明下和客户的合作情况?

汤林鹏:我们更多的可能还是跟这些行业客户合作,通用大模型也会有一些方案业务上的合作。在工业领域,我们跟一家头部能源企业建立了合作关系。通过构建AI数据库,我们帮助它把海量的结构化、非结构化的数据进行统一管理和查询,进而帮助它构建整个AI战略的基础设施。此外,在具身智能方向,我们也推出了若干落地方案,其核心同样依赖对多模态数据的统一处理与调用。

网易科技:能否介绍下元枢智汇目前的团队情况和融资情况?

汤林鹏:目前,公司的正式员工约为20人,团队总规模(含实习生、研究员等)约为40人。我们采取“产学研”融合的发展模式,与上海交通大学、北京大学、华东师范大学等高校保持深入合作。

目前处于第一轮融资阶段,也与一些市场化的产业投资人保持深度的洽谈。元枢智汇依托上海算法创新研究院和上海交通大学,已获得部分孵化资金支持。预计今年的营收可达数千万元,合同额有望进一步提升。

网易科技:元枢智汇的商业模式是怎样的?

汤林鹏:我们的商业模式主要为订阅制。AI数据库根据数据量设定使用单元,并按使用年限(如一年或三年授权)收费。在数据处理服务部分,也会根据所处理数据的体量进行定价。此外,我们还与合作企业共同打造其专属大模型与智能体,形成面向行业的个性化解决方案。

网易科技:元枢智汇未来几年的规划是什么?

汤林鹏:我希望把Data-centric AI的这套理念和工具立足上海和中国,推向全球,能够真正地被广泛地使用,把大模型和千行百业深度地结合。