2024年12月14日,昇思人工智能框架峰会在北京中关村国际创新中心召开,会上,18家单位发布基于昇思人工智能框架的原生开发大模型成果,面向金融、工业、互联网、电信、能源、交通等重点行业。
人工智能框架是AI时代的操作系统与软件底座,在智能时代起到承上启下的作用,上承各种业务模型、行业应用,下接芯片等底层算力,为开发者提供高效、便捷的开发平台,加速人工智能技术创新和应用落地。全球主要AI框架就有TensorFlow、Pytorch等。
其中,以2019年发布为起点,随后于2020年正式开源的昇思MindSpore AI框架已经历了5个春秋,作为帮助AI开发者快速创建、部署模型的工具,其技术持续更新,生态发展“一日千里”:目前昇思AI框架已孵化、支持50多个国内外主流大模型;其开源版本已累计获得1100万次下载,覆盖全球130多个国家和地区的2400多个城市;有3.7万多名开发者参与社区贡献。
在峰会上,中国科学院科技战略咨询研究院预测,昇思2024年新增市场份额将达到30%,成为业界发展最快的AI框架。毫无疑问,这些数字和进展,意味着昇思逐渐成为开发者在大模型时代AI框架的新选择。这不仅是“昇思”速度,也是中国软件根技术上,走出了重要的一步。
AI软件根技术发展重要一步
推出5年,开源4年,昇思MindSpore发展迅速。这一变化背后的原因并不难理解,正如华为ICT战略与业务发展部总裁彭红华就在峰会致辞中提及,“在大模型主导人工智能演进方向的新局面下,领先的AI框架需要同时具备‘更高效、更敏捷、更开放’的技术与生态能力,更快、更简、更稳地助力AI模型开发、训练、推理的全过程。“
显然,昇思符合上述要求。在搭建“更高效、更敏捷、更开放”的技术能力上,昇思MindSpore与主流AI框架对齐并超越,比如,昇思MindSpore采用了业界最全面的分布式并行技术,其中包括多副本、多流水交织并行等独创技术,整体可提升训练性能15%。昇思MindSpore还采用一套架构同时支持动态图与静态图开发,兼容主流开发方式,即使是新手也可以快速上手。
一个好的AI框架与操作系统一样,离不开广大开发者的参与。昇思通过打造自己的开源社区,鼓励开发者贡献能力;与学术界、产业界联合创新,孵化支持基于昇思的原生论文发表超过1700篇,位列全球第二、中国第一,并打造超过2000项解决方案。在线下,针对学界,昇思已经开展了全国360多所高校科研院所的合作,并联合超过290家高校实现教学。
目前来看,昇思是最活跃的开源框架社区,也是Gitee中国最佳开源贡献项目,AI领域创新力、生产力、稳健性得分全面第一,成为开源中国、Openl启智等开源社区最活跃的框架贡献者。
回顾历史,可以说,要发展AI,若没有深度学习框架,AI产业就无法成为如今面貌。
早期,谷歌的TensorFlow横空出世,它带着多项领先技术理念,以及大幅降低使用门槛的友好度。有了深度学习框架,工程师们在工作时调试算法,就如同厨师有了预制菜做饭,简单又高效。后来,2017年正式开源的AI框架PyTorch,凭借其灵活性优势受到了业界广泛欢迎。背靠金主Meta(原Facebook),PyTorch在生态培育、技术支持也迎头赶上。
不难发现,无论是生态建设,还是在低门槛适用,以及在技术的前瞻性方面,都是一个AI框架能被开发者认可的重要方面。目前来看,昇思无疑都走在了前面。
昇思在设计开发之初,就致力于为开发者提供高效、便捷的开发平台,加速人工智能技术创新和应用落地。2019年8月,华为发布昇思MindSpore,支持深度学习,为AI应用提供基础框架。
更大的变化发生在2020年,3月28日,华为正式开源昇思MindSpore,支持端、边、云协同训练和推理,并建立开源社区、组建技术委员,版本首年下载量突破10万。
昇思MindSpore开源社区理事长丁诚就是此次事件的亲历者,“我们把所有的MindSpore开发人员全部到开源社区进行开发,不再有内网外网之分,所有的代码直接在开发社区进行共享,做到了毫无保留的开放。”
开源之后,尽管前路仍然充满挑战,如生态建设、开发者体验优化、国际市场竞争等,但这些进展无疑为加速大模型的创新与落地、共建更繁荣的生态奠定了坚实基础。
落子“生态”,硕果累累
有了开源社区带来的共享共建,当AI开发上下游拧成一股绳时,会形成惊人的合力。生态的繁荣,铸就昇思的成功;而昇思的壮大,亦为解决AI落地问题提供了坚实支撑。开源后的昇思MindSpore,也迎来了技术迭代、生态发展最迅速的时期。
技术进展方面,2021年9月,昇思MindSpore 1.5版本发布,原生支持大模型训练,成为超大规模训练首选AI框架,加速企业和科研创新。2022年,昇思MindSpore多个新版本发布,支持大模型能力不断完善,性能持续提升,同时加强科学智能(AI for Science)能力构建,使能科研创新。
到了2023年6月,昇思MindSpore 2.0版本的推出,使其成为业界首个融合AI与HPC的框架。此外诸如MindSpore SPONGE生物计算、MindSpore Flow流体仿真、MindSpore Elec电磁仿真等AI4S(AI for Science)使能套件,共同使得AI+科学计算能力大幅提升,解决传统领域的科学智能计算算不快算不准的问题。
2024年3月,昇思MindSpore 2.3版本通过多维混合并行来实现超大集群的高性能训练,支持了大模型训推一体架构,并推出Transformers大模型开发-训练-微调-部署全流程套件,使大模型开发整体更简单、稳定、高效。
可以说,昇思MindSpore每一次版本功能迭代,都是基于社区开发者持续的开发与共建而来。在开源开放共建的理念下,昇思MindSpore不断向着更强性能和更佳易用性的方向演进。
在学术界,昇思完成了AI计算框架向AI融合框架的演进,原生支持AI4S,并面向制造、制药、航天等8大领域发布相关应用。在产业界,昇思MindSpore联合生态伙伴成立了大模型产业联合体,携手上下游企业共同加速AI落地。
凭借着昇思MindSpore在学界、业界齐发,技术、生态共建,以及低门槛、对中国开发者的极大友好等特性,在其使能下,相关生态参与者也有了令人瞩目的成果。其中包括中国科学院自动化研究所基于昇思孵化全球首个三模态大模型“紫东太初”、中国商飞联合昇思发布业界首个超临界翼型气动仿真AI大模型“东方·御风”。
南方电网公司战略总监、战略规划部总经理兼南网科研院董事长郑外生介绍,由南方电网公司牵头,会同华为等单位自主开发的AI科学计算的电力系统智能仿真器“驭电”,是基于昇思平台专业大模型在行业应用的典型案例。“驭电”可实现潮流生成分析、机电稳定分析、电磁稳定分析等多场景科学计算能力,能够在确保电网安全的前提下,最大限度利用新能源,解决当前新兴电力系统建设的痛点问题。
值得一提的是,“紫东太初”、“东方·御风”和“驭电”三项成果,均获得了世界人工智能大会最高奖项“SAIL奖”。
技术创新+坚定开放,找到更多可能性
AI框架要想成功,必须构建一个开放包容共享的生态系统,吸引更多合作伙伴加入其中。彭红华在演讲中提到,昇思将继续携手产业界客户、伙伴和广大开发者在三个方面共同努力,共促中国人工智能框架生态健康、高速发展。这三个方面就是探索前沿分布式技术,高效推动AI模型创新;强化全流程开发部署能力,加速应用落地;激发开源智慧,共建更开放的繁荣生态。
昇思MindSpore在此已有诸多实际动作,其设计之初就构筑了框架原生分布式并行能力,可以最大化实现算法泛化性,以应对快速迭代的模型技术。近期,昇思MindSpore还完善了多模型多任务调度、训推无缝转换能力,加速类o1模型演进升级。
在强化全流程开发部署能力,加速应用落地上,昇思聚焦生成式AI的快速开发和端侧部署,持续演进套件化开发及部署能力,如天级即可完成典型大语言模型部署,加速强化学习类大模型的推理与应用部署。
最后,在激发开源智慧、共建更开放繁荣生态上,昇思以技术为源赋能开发者,以众智计划、联合创新建立技术与科研连接,孵化科研成果。通过产业及生态联盟建立科研与产业连接,促进成果转化,实现产业发展。
中国工程院院士何友介绍,昇思开源社区影响力快速提升,已跻身全球主流AI框架第一梯队,成为中国发展最快的开源AI框架。“中国人工智能学会-昇思学术基金”,已成为学术界与企业界连接的桥梁。
基于AI框架的更大领域层面,华为也在坚持打造开放计算产业生态,与产业界共同打造鲲鹏、昇腾计算产业生态。提及面向AI计算领域和通用计算领域,华为的布局和进展。这种一站式、更完整的场景可以为生态成员带来更优的技术协同和更丰富选择,带来业务上的更多可能性。
需要注意的是,未来几年将是检验昇思和囊括其的开源计算生态,能否成长为世界级计算生态的关键时期,华为及其他相关企业需要共同努力。乐观来看,在科技发展的长河中,开源共建是驱动技术创新的关键力量。人工智能创新更需要打破界限,凝聚智慧,构筑生态,让技术更普惠、让创新可持续。
热门跟贴