打开网易新闻 查看精彩图片

国际开源服务器操作系统CentOS停更,引发了中国操作系统火线进化——开源龙蜥操作系统社区涌现出大量的技术创新,相关创新技术迅速转化为商业化产品。2024年6月,浪潮信息与龙蜥社区联合发布服务器操作系统云峦KeyarchOS V5.8 新版本(KOS V5.8 SP2),在产品性能、智能化、安全能力等方面进行了全新升级,特别是在国内率先支持英特尔第六代至强处理器,全面兼容各类硬件及部件的最新版本,强力支持CentOS替换迁移。

操作系统作为三大基础软件之一,鉴于其重要性也被誉为“大国重器”。由于CentOS在各行各业广泛的装机量,停更后为行业数智化带来了极大的挑战。为了确保CentOS停更后,部分无法替换操作系统的企业继续使用CentOS,浪潮信息与龙蜥社区推出了“停更无忧”行动计划,提供漏洞及Bug修复、故障定位与解决、安全加固等服务,有效防范停服后可能出现的新型漏洞、恶意代码引发的信息泄露、业务中断以及勒索攻击等严重风险。

打开网易新闻 查看精彩图片

随着6月30日CentOS 7停服最后期限的到来,以龙蜥为代表的中国操作系统社区和以浪潮信息KOS为代表的中国操作系统产品,在确保“停更无忧”和平滑迁移的基础上,开始着眼于后CentOS时代的全球操作系统新格局。

全球服务器OS新格局

国际Linux基金会2008年的一份报告曾指出,如果当时的Fedora 9发行版由商业软件公司开发的话,那么开发成本将高达108亿美元,而Fedora 9的代码量高达2亿行、5000多个组件包,需要6万人6年的开发。今天的开源龙蜥操作系统内含4亿行代码、3000多组件包、内核版本达4000万行代码,仅用三年左右时间就推出了14个商业衍生版……

随着龙蜥操作系统在全球操作系统产业中快速脱颖而出,全球操作系统开源社区格局也发生了新的变化。

打开网易新闻 查看精彩图片

首先,当今服务器操作系统相关的全球开源上游基金会包括APACHE基金会、自由软件基金会、Linux基金会、OpenAtom开放原子基金会、云原生计算基金会CNCF、开源基础设施基金会OpenStack等六大顶级开源基金会,其中成立于2020年的OpenAtom开放原子基金会是由中国厂商和企业客户主导的国际上游顶级开源基金会。

其次,在国际上游顶级开源基金会之下,是包括Fedora社区、OpenAnolis龙蜥社区、Debian社区等在内的国际Linux根社区。所谓根社区,即基于Linux内核和其他开源组件进行构建,不依赖上游发行版的社区体系,能衍生出不同分支或下游社区。其中,Fedora项目由Red Hat红帽公司赞助、Fedora Linux为Red Hat Linux的上游版本,而CentOS即是Red Hat Linux的免费社区版本。可见,只有掌握根社区,才能在后CentOS时代“长治久安”。

第三,在根社区下游是各种发行版、商业衍生版和企业定制版。例如在Fedora之下,最新出现了CentOS Stream,作为Fedora Linux的服务器滚动更新版,再之下为Red Hat Linux,再由Red Hat Linux衍生出停服的CentOS Linux,以及Oracle Linux、Rocky Linux等商业衍生版;而在OpenAnolis龙蜥社区之下,则为浪潮信息KOS、中兴、统信等商业衍生版和阿里云Linux等企业定制版;在Debian社区之下则有著名的Ubuntu Linux。

在2024年5月的龙蜥社区分别第14次技术委员会会议和第24次运营委员会会议上,技术委员会主席杨勇表示,之前预期CentOS停服会迅速改写开源操作系统的格局,但通过观察 CentOS 6 EOL后逐步淡出过程,就会发现这绝非短期内能够彻底完成的变革,而是需要社区长期持续的投入和支持。

换言之,应对CentOS停服仅仅是一个开始。从成立OpenAtom开放原子基金会和OpenAnolis龙蜥社区,推出全面兼容CentOS的Anolis 7/8以及刚于2024年6月推出完全基于新架构、首个大规模集成众多合作理事与伙伴贡献的社区发行版本Anolis 23.1 GA版,中国服务器操作系统正在全球新格局中崛起。在后CentOS时代,一边继续推进操作系统迁移,同时从源头加强“长治久安”,这才是可持续发展之道。

“小步快跑”替换CentOS

龙蜥社区自2020年就推出了CentOS停服专区,制定了迁移作业的整体方案,配合方案研发了迁移适配、调优和兼容性工具,提供可持续的安全更新服务,建设软硬件兼容规范测试验证平台。在2024年6月25日的浪潮信息“元脑中国行”全国巡展上海站上发布的“停更无忧”计划,进一步为暂时无法进行操作系统迁移的用户提供了托底服务。经过三年的迁移工作,浪潮信息与龙蜥社区都认识到没有“一刀切”的替换方案。

龙蜥社区共有三大产品系列:Anolis 7、Anolis 8和Anolis 23及之后的版本等。其中,Anolis 7、Anolis 8分别是全面兼容CentOS 7和CentOS 8的版本,可以实现从CentOS 7/8向Anolis 7/8的平滑迁移。龙蜥社区还提供了从CentOS 7迁移到Anolis 7、从CentOS 8迁移到Anolis 8、从CentOS 7迁移到Anolis 8三大详细迁移手册。相应的,浪潮信息的KOS操作系统到目前为止都是基于Anolis 7/8的稳定版本。

浪潮信息系统软件产品部总经理苏志远博士在“元脑中国行”全国巡展上海站上接受采访时表示,最新发布的KOS 5.8 SP2是KOS 5.8的升级版本,KOS 5.8基于Anolis 8系列,SP2对应于Anolis 8.9 ,其内核版本也是当前主流稳定龙蜥操作系统最新ANCK 5.10内核。今年3月,KOS刚刚升级支持ANCK 5.10,新增CXL分层内存优化、代码多副本、增强网络收包能力等功能特性,再次提升了系统性能和稳定性。

打开网易新闻 查看精彩图片

在稳定性方面,升级到ANCK 5.10内核的KOS进行了增强,支持内核热补丁功能,在不停机状态下进行内核漏洞和 bug 的修复,保证关键业务连续运行,提供集群高可用软件栈,有效支撑了应用高可用部署、故障无感切换,LTP(LinuxTest Project)测试通过率达到 98%,RAS性能达到业内领先水平。换言之,KOS保证了CentOS迁移后的系统稳定性,高效满足了企业生产系统的要求。

在性能方面,KOS 5.8 SP2在国内率先支持英特尔第六代至强处理器,全面兼容各类硬件及部件的最新版本,在调度、内存管理、网络、IO方面进行了大量优化,实现SPEC CPU性能提升29%、文件系统性能提升100%、MySQL数据库性能提升16%、Redis性能提升60%,让用户的关键企业智能化应用运行更加流畅高效。

在安全性方面,KOS 5.8 SP2构建了完善的内生安全机制,实现基于eBPF技术的“零侵入”安全防御,并通过KSecure企业版提供主机系统“自适应”安全增强,达到“双保险”安全防御。基于可信计算技术,KOS 5.8 SP2实现从硬件层的静态可信验证到系统层和应用程序运行时的动态可信验证,形成软硬件一体化的全栈可信解决方案,还让基于多种硬件架构的服务器实现了进程级、容器级、虚拟机的可信执行环境,满足企业数据库、机器学习、大数据应用的原生运行需求,构建了“金融级”数据安全机密计算解决方案。

在KOS的基础上,浪潮信息提供了X2Keyarch迁移工具,该工具提供了多种迁移方案,以适应不同业务场景和数据结构的需求,支持批量迁移、增量迁移、分批迁移等多种方式,并可对迁移数据进行校验和清洗,以确保数据的准确性和完整性。

苏志远介绍,过去三年,浪潮信息帮助客户进行了大量的迁移工作,通过实践发现“原地升级”在大多数情况下并不是最佳方案。这是由于操作系统与软件和硬件的关联十分紧密,特别是基于C/C++的应用程序,与操作系统的绑定十分紧密,“原地升级”面临着很大的风险。

因此,很多浪潮信息完成的迁移项目,都是“小步快跑”式迭代替换。例如一个集群上百个节点,拿出10个临时“中转”节点,将10个节点迁移到新操作系统上稳定运行无误后,再循环替换下10个节点,直到整个集群全部轮换迁移完毕,这样既充分利用了原有设备,又能迁移到新操作系统上。

基于“小步快跑”的方式,KOS支撑某运营商关键基础设施业务CentOS替代,采用无人值守的方式,快速、平滑地将客户原有的CentOS7迁移到KOS 5.8版本,充分利用了原有设备,经过迁移后调优,业务整体性能提升10%。

在教育领域,KOS助力某高校科学计算集群优化中心完美替换CentOS,向下统一纳管现有基础设施,向上兼容分布式存储软件、高性能应用软件,满足各学科分类教学实训需求,Lustre综合运行性能相比CentOS 7提升20%以上,集群Alltoall性能相比CentOS 7提升20%。

苏志远强调,由于KOS的产品化与标准化程度非常高,只需要将操作系统和迁移工具交给客户,客户基本都可以自行完成迁移。当然,KOS本身的稳定、性能和安全也足够支撑关键业务需求,例如KOS有效支撑某大型银行,承载70多个核心业务,包括风控、国际结算、第三方结算、手机银行、渠道业务等,在其渠道二期项目中,KOS稳定支撑双11当天超1.5亿笔交易,顺利满足业务峰值需求。

凭借十余年高端主机操作系统经验沉淀、全面的产品体系、龙蜥的生态优势和遍布全国的软硬件全服务链,浪潮信息KOS广泛服务于金融、通信、教育、互联网等行业用户。而新发布的KOS 5.8 SP2,将支持原CentOS用户采用最新的英特尔至强6能效核心,在迁移的同时也不错过全球芯片技术潮流。

大模型智算,下一个战场

在2023年底的首届龙蜥操作系统大会上,龙蜥社区宣布了9大技术方向,特别将智算方向新增为第9大技术方向。对于下一代服务器操作系统来说,AI原生是一个必不可少的技术方向,除了像Anolis 23这样完全重构的操作系统中纳入大模型AI等智算技术外,现有Anolis 8也需要加强对于大模型AI和异构芯片等智算技术的支持。

浪潮信息系统软件产品部总经理苏志远博士在“元脑中国行”全国巡展上海站上强调,System for AI以及AI for System是KOS 5.8 SP2的重要特色之一。

打开网易新闻 查看精彩图片

所谓System for AI,即KOS要支持AI容器镜像、训练推理优化等AI软件。KOS 5.8 SP2实现AI开发环境快速上线,包括为GPU、HCA卡等AI服务器关键部件驱动及CUDA/NCCL等GPU生态软件提供了最佳版本选型,预植lustre/BeeGFS等并行文件系统,并通过自动化工具快速配置AI开发环境,可在20分钟完成200节点的AI训练基础开发环境上线可用。

在4月份的IPF 2024上,浪潮信息刚发布了面向企业大模型开发的软件平台“元脑企智EPAI(Enterprise Platform of AI,EPAI),为企业AI大模型落地应用提供高效、易用、安全的端到端开发平台,同时发布的千亿参数源2.0大模型、可运行千亿参数大模型的AI通用服务器、面向万卡集群的超级AI以太网交换机和大模型应用专用存储等,都是基于KOS操作系统。也就是在KOS和全栈软硬件AI产品平台上,企业客户已经一脚迈入了大模型智算时代。

而AI for System,即将大模型和AI技术等用于操作系统的智能运维和调优等。KOS 5.8 SP2融入开箱即用的Yuan-Chat解决方案,具备智能问答、智能编程能力,并且集成服务器智能运维、操作系统智能运维、智能调优组件,实现了系统故障智能定位、自动化部署管理、专家经验一键调优等更智能的操作系统使用体验。

KOS新版本通过整合系统环境及相关组件,极大简化了大模型部署复杂度,让大模型应用部署变得简单高效。以智能AI助手YuanChat安装为例,KOS将NV底层组件、Miniconda相关Linux命令及研发所需环境、源2.0大模型及运行的依赖软件、容器相关组件以及YuanChat官方软件分别打包为rpm包,融入基础ISO镜像中,固化默认最优配置,形成开箱即用的YuanChat的ISO镜像,相比原来复杂繁琐的安装流程,实现了极度简化的部署。

在KOS的智算技术体系之外,龙蜥社区理事长单位阿里云在今年6月正式推出了OS Copilot邀测版。OS Copilot 结合LLM大模型的自然语言优势,加上操作系统团队的历史经验微调,给Linux用户在学习、运维、开发等不同领域带来专业、高效、智能的全新体验。例如,在系统运维和调优这一关键环节,OS Copilot通过自然语言指令即可调用高级工具,无需用户具备深厚的专业背景,可轻松完成原本复杂的工作流程。

从去年底提出智算技术方向,到如今推出OS Copilot邀测版,大模型时代的操作系统正在快速“智变”。杨勇表示,目前OS Copilot还处于起步阶段,今年5月份,龙蜥技术委员会提出了统一文档库项目,未来希望把社区文档库变成OS Copilot专业、高质量的语料。这样,OS Copilot就将成为操作系统的“大脑”,未来或将颠覆操作系统的理念。

整体来说:跨过2024年6月30日CentOS停更的最后期限,全球操作系统产业进入了后CentOS时代。对于业内厂商以及企业用户来说,操作系统选型不再仅是迁移选项,更需要着眼后CentOS时代的“长治久安”以及长期创新能力建设。在全球服务器OS新格局中,所有的参与者都要重新审视自己的定位和战略,继而调整各自的下一步执行行动计划——搭上中国操作系统这个“新高铁”,跑出刷新认知的中国创新加速度!(文/宁川)