4 月 15 日,在 SENSOR SHENZHEN 2026 (深圳国际传感器与应用技术展览会)同期举办的“传感器赋能算力中心研讨会”上,XSKY 星辰天合展示了传感器数据全生命周期存储解决方案,解决方案总监战策发表了题为《XSKY AIMesh 与多传感器数据融合》的主题演讲。聚焦自动驾驶和具身智能典型的多传感器多模态数据融合场景,系统阐释了如何以统一数据平台实现从路采采集、清洗标注、模型训练到仿真验证的全生命周期管理。
传感器数据爆发
存储成为关键瓶颈
自动驾驶被公认为是传感器数据密度最高、数据管理复杂度最大的 AI 落地场景之一。
一辆 L4 级自动驾驶车辆通常搭载数十个传感器——激光雷达每秒产生数百万个点云数据,多路高清摄像头以 30fps 的帧率持续采集图像,毫米波雷达实时输出距离和速度信息,再加上 GPS/IMU 的定位数据、CAN 总线的车辆状态数据等,单车日数据采集量可达数 TB。
这些数据在后续的算法研发流程中,需要经历采集上传、数据清洗、数据标注、模型训练、仿真验证等多个环节。每个环节对存储系统提出了截然不同的要求:
采集上传阶段
海量小文件并发写入,对写入吞吐和元数据管理能力要求极高,且往往涉及跨地域数据传输。
数据清洗与标注阶段
需要快速检索和随机访问历史数据,对读取性能和智能检索能力有明确要求。
模型训练阶段
大规模 GPU 集群需要 Tbps 级的吞吐和微秒级时延,存储性能直接决定 GPU 利用率。
仿真验证阶段
需要回放历史路采场景数据,对顺序读取带宽和低时延有高要求。
然而,当前行业普遍面临以下存储痛点:
数据孤岛严重
采集、标注、训练、仿真各环节使用不同的存储系统,数据流转依赖人工搬运和格式转换,效率低下且容易出错。
存储成本失控
路采数据需要长期保存以支撑算法迭代和合规溯源,但传统方案缺乏智能分层能力,冷热数据混存导致成本居高不下。
跨域协同困难
数据往往需要在边缘站点、中心机房和公有云之间流动,跨云跨域的数据同步和权限管理成为瓶颈。
GPU 利用率不足
训练阶段存储性能跟不上 GPU 算力,导致 GPU 经常处于等待数据的状态,算力投资无法充分发挥价值。
XSKY AIMesh
为多传感器数据融合而生的统一存储平台
针对自动驾驶多传感器数据的全生命周期管理需求,XSKY 基于 AIMesh 统一数据平台(MeshFS 全闪并行文件系统 、 MeshSpace EB 级全局统一数据湖、MeshFusion 面向 AI 工厂的融合存储底座),构建了覆盖"采集-处理-训练-归档"的全栈 AI 数据方案。
多协议统一接入,消除数据孤岛
原生支持 POSIX、S3、NFS、SMB、HDFS 协议,跨协议无损互通,覆盖智能驾驶全流程:传感器采集(POSIX)→ 数据处理(S3)→ 模型训练(CSI/HDFS)→ 仿真测试(NFS),各环节与存储层双向数据交互,无需协议转换,同一份数据多种访问方式。
RDMA极致性能,突破训练 IO 墙
端到端 RDMA 无损网络 + 自研高性能客户端 + NVMe 全闪介质,提供 TB/s 级聚合带宽与微秒级时延,大幅提升 GPU 集群利用率,终结算力空转。
智能冷热分层,数据自动流转
MeshFS 全闪性能层(NVMe)承载高频训练数据,MeshSpace 容量层(HDD)承接低频冷数据与历史归档。统一命名空间下两层无缝协同,冷数据自动沉降,热数据可预热加载,透明访问,业务无感知。
成本优化,降低 AI 总持有成本
单车日增 2-10TB,万辆车年增 7.3PB,路采数据的长期保存需求带来持续的成本压力。存储在 AI 总成本中占比高达 30%-40%,通过 MeshFS + MeshSpace 双层架构的智能冷热分层,高频数据驻留全闪层、低频数据自动沉降至容量层,从源头控制存储成本增长。
场景实践
某全球顶级 Tier1 智驾供应商
路采数据日增量超 8TB,面临数据孤岛、性能与成本失衡、跨国协同等挑战。XSKY 为其部署全栈 AI 数据湖方案,全闪/混闪分层架构配合全协议互通,覆盖"采集-处理-训练-仿真"全流程,以 EasyData 实现跨境数据合规同步与智能分层管理,支撑私有云与公有云间数据按需流动,实现成本、性能与合规性兼顾的数据全生命周期管理,助力客户打通智驾数据闭环。
深圳某头部智驾解决方案供应商
原有 AI 基础设施仅 1.5PB 集群与 500TB OSS,难以支撑全业务流程。XSKY 部署分布式全闪文件系统,单集群统一命名空间、全闪+混闪分层、NFS/HDFS/S3全协议互通,Mtime 智能分层实现数据透明归档,提供80GB/s 高带宽,扩容全程业务无感知。客户零改造上线智驾数据闭环,TCO 大幅降低。
国内头部 Robotaxi 厂商
上百辆采集车日增数据 500TB,原公有云 OSS 存储成本高企。XSKY 在北上广深及美国部署多套 v6 存储集群,总可用容量超 40PB,文件全闪池支撑 GPU 训练、对象混闪池实现冷热分层降本,多中心数据按需迁移无需第三方工具,存储成本大幅下降,数据完全自主管控。
从自动驾驶到具身智能
统一数据底座的延伸
自动驾驶作为具身智能的重要子场景,其对多传感器多模态数据融合的管理需求,本质上是具身智能各细分领域的共性挑战。
无论是自动驾驶车辆的激光雷达和摄像头,还是机器人本体的视觉、力控、关节状态传感器,都需要解决海量异构数据的统一接入、高效处理和长期管理问题。XSKY 在自动驾驶场景中沉淀的统一数据平台能力——多协议接入、智能冷热分层、云边协同、极致性能——同样适用于更广泛的具身智能领域。
展望
从工业制造到临床影像,从智能驾驶到具身智能,传感器是 AI 系统的"感知源头",而存储则是将这些感知数据转化为 AI 生产力的"数据底座",传感器数据的管理效率直接决定了 AI 算法迭代的速度和产品落地的质量。
XSKY 将持续深耕传感器数据管理领域,以 AIMesh 统一数据平台打通从数据采集到模型训练的全链路,帮助工业制造、自动驾驶、具身智能、医疗影像等领域的企业构建高效、安全、低成本的数据基础设施,让传感器产生的每一份数据都能转化为可落地的 AI 生产力。
了解更多 AI 时代的统一数据平台方案,敬请访问 XSKY 星辰天合官方网站:https://www.xsky.com
热门跟贴