从2023年的ChatGPT,到2024年的Sora,生成式AI和大模型技术正以不可思议的发展速度颠覆着我们的认知。然而,作为AI时代的核心支柱之一,传统的数据存储基础设施已很难满足企业快速增长的数据需求,更无法支撑企业通过AI激发新质生产力的要求。
IDC报告显示,中国AI大模型市场预计2024上半年达13.8亿元,2028年将增至211亿元。AI大模型的兴起对计算、网络及存储能力均提出了新的挑战。特别是数据量增长使存储技术在AI数据周期中变得更加至关重要。也正因此,企业亟待构建高效、强大、便捷的数据存储架构,支撑AI,优化决策与运营,确保数据安全,降低成本,实现业务增长。
在此背景下,今年11月15日在上海举办的“AI赋智数据”——联想凌拓技术大会(INSIGHT CHINA)上,联想凌拓通过汇聚全球科技与创新力量,聚焦数据与智能交汇时代下的数据基础设施变革,探讨企业如何借助生成式AI与智能数据基础架构的融合,并通过技术的创新打破数据孤岛,加速自主AI应用落地,帮助企业实现数据到智能的转型,由此更快地加速千行万业拥抱AI智能化新时代。
正如联想凌拓首席执行官杨旭所言:“作为一家智能数据基础设施服务商,联想凌拓始终围绕着‘AI如何赋能数据,以及如何将数据反哺为AI’这一核心理念,不仅面向客户提供先进的技术和方案,更致力于推动AI与数据的深度融合,最终目标是通过技术创新赋能行业客户实现数据价值的最大化,共创AI赋智数据的新未来。”
01.
数据存储行业迈入2.0时代
规模定律(Scaling Law),揭示了在当前深度学习算法框架下,算力和数据之间的关系:更强的算力加上更多的高质量训练数据,是构建优质AI大模型的基础。
在此过程中,高质量的行业数据成为AI规模化应用的核心。比如,行业和场景模型需要规模化的行业数据对基础大模型进行二次训练和微调,生成针对特定行业的垂直模型;在推理阶段,高质量的知识库是消除幻觉并提升应用效果的关键。
联想凌拓首席执行官 杨旭
换句话说,不管是基础大模型的训练,还是大模型在行业的应用落地,都离不开大规模高质量的数据。从这个角度来看,数据的规模和质量决定了AI智能的高度,同时也让构建智能数据基础设施,打造更高效、更可靠的数据存力底座变得“刻不容缓”。
事实上,和传统存储代表的1.0时代相比,AI时代下的数据存储行业无疑已迈入2.0时代,联想凌拓将存储的需求划分为五个阶段,即数据整理、训练、推理、大模型和企业应用,每个阶段对存储的性能和功能的要求都是截然不同的。
例如,在数据整理阶段,企业会面临着数据种类繁多、规模庞大的挑战,这就需要采用高效的平台和基于闪存的分布式存储来平衡性能和容量需求;在训练阶段,性能是核心需求,超算级别的高性能存储能够充分释放GPU算力,加速模型训练;至于推理阶段,则需要在吞吐、时延和数据安全之间找到最佳平衡。
而在大模型和企业应用阶段,过去一年,国内的大模型数量从几十个增长到三百多个,但与此同时,大多数企业因无法承受超大规模算力和存力的投入,因而更注重小规模、高精度的模型训练与推理,同样这也对存储技术提出了新的要求,既需要提高可持续性和平衡性,又要强化运维能力。此外,特别值得注意的是,数据安全也是重中之重,防止勒索攻击和其他威胁同样也成为了当前AI存储解决方案中需要具备的核心能力之一。
也正是洞察到这种全新的变化,联想凌拓依托联想和NetApp两大母公司所形成的独特优势,并基于“123”战略,即一个核心目标,客户成功;两个创新引领,产品创新和方案创新;三个发展体系,即产品、服务和生态,为行业客户提供完善的智能数据基础设施,为千行万业构筑坚实的AI存储底座,为企业走向AI新时代按下“快进键”。
杨旭表示:“联想凌拓希望高效且安全地为客户及业务提供AI的强大能力,让企业数据在任何地点、以任何方式实现AI优化,同时高效地理解并管理数据,以支持AI应用,最终成为千行万业可信任的技术建议专家、可托付的风险管控专家、可依赖的成本控制专家,以及可追随的未来规划专家,通过持续提供业内先进的技术,让行业客户在实际的业务场景中实现真正的价值创新。”
02.
构筑智能数据基础设施底座
当前,联想凌拓正围绕未来数据演进和企业对于AI应用的核心需求,通过“软硬兼施”、“深度融合”的双重创新,构筑智能数据基础设施底座,这不仅能够更好地帮助企业应对AI时代对于“存储底座”的要求和挑战,更为AI应用真正“扎根”于千行万业,激发企业的新质生产力加装了“新引擎”。
联想凌拓产品管理与营销高级总监 林佑声
一是,在硬件底座方面,联想凌拓依托母公司NetApp的技术优势,发布了一系列新型存储产品体系,可为行业客户提供“因地制宜”的存储解决方案。
据联想凌拓产品管理与营销高级总监林佑声介绍,在统一存储领域,全新发布的统一混合闪存FAS90与FAS70拓展了联想凌拓混合闪存存储阵列产品线,新产品基于NetApp最新硬件平台与ONTAP 9.15.1系统打造,兼具经济性、简易性和安全性,能够有效提升传统数据基础架构的生产率。
与此同时,全新的统一大容量全闪存AFF C 系列产品,包括AFF C80、AFF C60和AFF C30,专为追求效率与容量完美平衡的用户设计,兼顾提高存储效率和容量,且所有新型号均支持CPU QAT压缩卸载引擎,不仅将最大容量提升了100%,扩展性增强了50%,更实现了平均性能高达55%的飞跃式提升;此外,全新的统一全闪存AFF A系列,包括AFF A50、AFF A30和AFF A20,则专为下一代全闪存工作负载而设计的高性能存储系统,同样在QAT压缩卸载引擎的“加持下”,展现出优异的160GB/s数据压缩能力。
而在SAN存储领域,联想凌拓则推出了全新的高性能SAN存储 ASA A系列,由ASA A1K、ASA A90和ASA A70组成,该系列产品采用了经过优化的块存储技术,凭借此系列,联想凌拓将能够以极具竞争力的性价比,提供兼具简易性、强大性能以及先进数据管理和保护功能的全闪存存储解决方案。
二是,在软件创新方面,NetApp的ONTAP技术作为行业内最成熟的数据管理平台之一,能够通过功能强大的“快照”技术和Data Fabric架构,帮助企业实现“云上云下、跨云调用”的能力,从而为数据的快速调度和最优配置提供了有力支持,特别是传统存储需要统一格式后才能管理,而ONTAP技术则能够直接支持多源数据的高效管理和优化,由此让数据处理更灵活、更高效。
在此基础上,数据安全作为行业客户的核心关注点,ONTAP也通过创新的双活方案、数据灾备和容灾等技术,大幅降低了系统停机风险。除此之外,ONTAP还提供了一系列软件解决方案,针对防勒索、防病毒和数据质量问题进行保护,进一步提升数据的安全性与可靠性。
“这些软实力虽然不像硬件性能提升那样直观,但它们是支撑数据管理能力的关键所在,真正帮助了客户在日益复杂的业务场景中,实现了更高效、更安全的数据运营。”林佑声说。
三是,在深度融合方面,联想凌拓结合中国AI市场特有的实际需求,推出了能够满足企业AI需求的AIPod参考架构,进一步引领了智能数据基础设施未来的演进方向。
客观地说,当前大部分企业客户对AI的认知还停留在基础阶段,同时缺乏大规模GPU算力的能力,而通过AIPod,联想凌拓真正为行业客户提供了一个AI实验验证平台,这种模式不仅降低了客户的试错成本,还为他们提供了清晰的性能数据,便于申请预算或制定下一步计划。总体而言,AIPod的核心理念是“扶上马,送一程”,让客户专注于AI与业务场景的结合,而无需过多担心硬件架构的复杂性。
在林佑声看来:“AIPod绝不是简单的硬件堆砌,而是硬件与软件深度融合的成果。在未来,联想凌拓也将计划进一步强化AIPod的验证平台能力,结合各行业的实际需求,推出更多针对性的解决方案,推动AI技术在企业中的实际落地。”
值得一提的是,联想凌拓还通过持续探讨中国客户的实际需求,并与NetApp全球研发团队紧密合作,推动下一代存储产品在灵活性和AI适配能力上的突破,这些新的存储产品和方案不仅是硬件性能的提升,更是对软件功能和应用场景的全面重新设计,由此可以确保存储技术能够在AI时代充分发挥其潜力。
在传统存储的智能化升级方面,可以发现传统存储过去更强调可靠性和稳定性,但在AI场景中,灵活性和数据多样性变得尤为重要,而这就需要开放更多数据接口,同时结合创新能力,以匹配AI算力对动态需求的支持。在这方面,联想凌拓作为首家大规模推广QLC闪存的公司,通过新介质结合更灵活的软件功能,使能传统存储焕发新活力。
在分布式全闪存储的演进方面,当下市场典型的“混闪”架构,虽然性价比较高,但性能往往一般,已无法满足AI的复杂需求。同时,下一代分布式全闪存储还需要提供更为高效的AI接入体验,并且需要配备更先进的软件支持,例如,目前市场上的GPFS和NaaS技术已有20多年历史,其功能已难以完全适配AI场景。基于这些市场需求,联想凌拓也正在研发分布式全闪存储2.0,通过更智能化的架构和优化的软件功能,进一步支持AI技术的发展。
毫无疑问,在全新的AI时代,存储市场正在随着新技术、新应用、新介质的出现而不断进化和改变,而在此过程中,联想凌拓不仅以前所未有的前瞻力、创新力和产品力,打造了智能数据基础设施的坚实底座,更引领了整个AI存储未来发展的新方向和新趋势,由此也将会加速中国企业和行业数智化变革的进程,并最大化激发新质生产力的产生。
03.
加速行业驶入智能化快车道
当前,以大模型为代表的AI技术尽管在行业中取得了快速的发展,但在技术与应用之间,在通用的AI能力与定制化行业和企业需求之间,如何解决不同规模、行业、企业的AI应用落地等问题上,仍然存在“最后一公里”无法满足的情况,而背后的主要原因在于:
一方面,任何技术本身都是不具备行业属性的,脱离了场景的技术也无法称之为有用的技术,这也代表着AI和大模型技术必须要通过融入企业或者行业场景才能更好的展现其价值;另一方面,大部分AI技术都是通用技术,这些技术本身要变成新的数字生产力,其实还需要与之配套的服务、应用体系和方法论,乃至更多的落地应用才能形成最佳实践。
基于此,联想凌拓不仅依托母公司提供的技术支持,更通过自主研发和解决方案团队,深入客户的实际应用场景,提供场景化解决方案,加速中国企业的数智化转型升级进程。
对此,杨旭说:“客户的需求变化为我们的方案迭代提供了重要的反馈,从而让联想凌拓的产品始终保持竞争力和实用性,这种‘客户需求-产品迭代’所形成的闭环,正是联想凌拓快速响应市场的关键所在。”
在媒体娱乐行业,渲染过程中通常会产生大量碎片化文件,这些文件需要高速处理,如果稍有延迟,就会影响整体效率,为此,联想凌拓与客户的设计师和工作室紧密合作,通过优化数据部署与计算连接,为这些行业客户就提供了最适合的解决方案,类似的技术优势同样适用于芯片设计和其他复杂计算场景。
在智慧医疗行业,AI辅助诊断通过整合多维度数据,不但可以大幅提高诊断的精准性,还能帮助医生发现传统方法难以察觉的病症,而多源数据输入为数据质量提升提供了重要基础,基于此,联想凌拓也通过分布式存储技术和场景化优化的架构,为智慧医疗的落地提供了强有力的支撑。
在智慧金融行业,联想凌拓则推出了金融行业端到端数据管理解决方案,这一综合方案广泛覆盖了云基础设施、core bank、SOA、人工智能等多个关键应用场景,构建了一个全面而强大的数据管理生态,此外该方案还深度融合了核心SAN存储、全闪存统一存储以及去中心化的对象存储等尖端产品,能够为金融行业的各类具体场景提供了高度定制化、高效能的落地解决方案。
不仅如此,大模型正在赋能千行万业,但也面临着海量、优质的行业数据集严重匮乏的挑战,尤其是行业数据中包含了领域特有的知识、术语、规则、流程和逻辑,这使得其往往难以在通用数据集中充分覆盖。
以主题公园中的AI应用为例,虽然通用AI可以生成“文生图”,但常常会有缺陷(比如生成的猫有六个脚趾),唯有将行业规则、知识库与AI技术深度结合,才能真正提升效率并解决实际问题。联想凌拓的AIPod正是这样一整套定制化解决方案,它融合了小模型、行业模型和ISV的资源,能够更快的帮助客户快速实现AI的技术落地。
回头来看,这些成功的落地案例仅仅只是联想凌拓加速赋能千行万业智能化转型的“缩影”。今天,无论是在智能制造、智慧金融、智慧医疗、智慧政教还是媒体娱乐等行业,都始终活跃着联想凌拓的身影,而这种基于“技术创新+场景应用”驱动的全新模式,可以说联想凌拓真正助力了更很多中国企业释放了数据要素价值,并加速了AI应用的创新发展。
当然,杨旭最后也强调表示,当前很多AI场景,比如训练和推理的结合,虽然已经广泛采用分布式存储来支持高效的算力部署。然而,在一些特定领域,传统存储依然不可或缺,特别是在数据安全和法规合规方面传统存储仍然扮演着“关键角色。”
举例来说,金融机构和无人驾驶研发领域需要处理海量数据。过去,这些数据大多存储在公有云上,但随着法规的逐步完善,关键数据需要在本地存储,客户因此不得不调整架构。在这样的场景中,传统存储同样也以其高集中度、强安全性和出色的可管理性成为客户的首选。对联想凌拓而言,分布式存储与传统存储都各有其应用场景,而联想凌拓也将通过结合两者的优势,致力于为行业客户提供更加灵活高效的存储解决方案。
而面向未来,联想凌拓也将会继续通过强化生态合作伙伴关系,深耕行业场景,推出更完善的解决方案,特别是在AI存储领域,联想凌拓将通过硬件和软件的双向创新,进一步为行业客户提供更高效、更可靠的智能数据基础设施,加速行业驶入智能化快车道。
总的来看,AI大模型的爆发,带来了一场深刻的“数据革命”和“存力革命”,也正深刻改变着存储基础设施的演变进程,而联想凌拓不仅前瞻性地推出了新一代AI解决方案,还“与时俱进”地推动着智能数据基础设施的“创新求变”,更通过本地化和场景化的深度创新,为行业客户提供“因地制宜”的AI解决方案,由此更好地将AI融入千行万业,相信在加速企业数智化转型提速的同时,也必将更好地推动中国数字经济高质量发展“更上层楼”。
热门跟贴