在天文领域,大模型如何发挥本领?

近期,由中国科学院国家天文台人工智能组推出的天文大模型“星语3.0”,已经成功接入国家天文台兴隆观测站望远镜阵列。该模型可以自主控制望远镜观测、分析观测结果,给出后续观测建议,能让科研人员从繁琐的天文观测中解放出来,更多地专注于天文发现。据了解,“星语3.0”基于阿里云通义千问开源大模型打造而成,是大模型在天文观测领域的首次应用。

实际上,通义千问大模型诞生一年以来,落地应用的速度不断加快。除了如上提到的天文领域,也已经进入PC、文旅、航空、矿业等多个领域。

2024年5月9日,在AI智领者峰会·北京站上,阿里云CTO周靖人围绕技术、生态和落地三大层面,分享了公司在大模型领域取得的新进展。

发布通义千问2.5版本,让通义APP真正做到“通情、达义”

会上,阿里云正式发布通义千问2.5版本,多方面基础能力均实现大幅提升。具体来说,相较于通义千问2.1版本,新版的理解能力、逻辑能力、指令遵循和代码能力,分别提升9%、16%、19%和10%。经过权威基准OpenCompass评测,该模型的中文性能比如文本理解、文本生成、知识问答等多个方面,全面赶超GPT-4 Turbo。

打开网易新闻 查看精彩图片

(来源:资料图)

与此同时,通义大模型也迎来品牌升级,“通义千问APP”更名为“通义APP”,仍将免费地为全球用户提供服务。

首先,从文档处理能力来看,通义APP单次可处理高达1000万字的长文档,并能同时解析100份不同格式的文档。其次,从音视频理解能力来看,能够同时上传50个音视频文件,并对其进行包括内容识别理解、摘要总结、多语言翻译在内的多项处理。此外,从代码编程能力来看,集成智能编码助手通义灵码,帮助所有用户提高编码效率。

值得一提的是,为满足企业用户在私域知识检索、企业数据合规等方面的需求,在本次峰会上,通义灵码发布标准版和专属版两个企业版本。前者可接入企业私域知识,实现相关问答;后者能提供公共云上专属实例部署等服务,满足大中型企业客户定制模型、节约算力的需求。

就阿里云而言,其希望通义APP在全面升级之后,能够真正做到“通情、达义”,成为人们在工作、学习、生活和娱乐方面的全能AI助手。

打开网易新闻 查看精彩图片

(来源:资料图)

推出千亿参数开源模型,全方位推动开源体系构建

大模型的发展离不开整个生态。

阿里云认为,将AI技术赋能给企业和开发者,帮助他们更快地实现应用创新,和升级大模型技术一样重要。因此,其也在积极推进开源体系的构建。

从模型尺寸上看,推出一系列不同参数的大模型,让用户能够根据自身场景,快速挑选合适的模型开展业务创新。从模型模态上看,在推出语言模型的同时,也发布视觉理解模型、声音模型和代码模型等多种模态的开源大模型。

本次峰会上,阿里云发布新款开源模型——1100亿参数的Qwen1.5-110B。目前,该模型在MMLU、TheoremQA等基准测评中超过Meta发布的Llama-3-70B模型,并成为HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上的榜首模型。

打开网易新闻 查看精彩图片

(来源:资料图)

除了推出开源大模型,阿里云也在努力推广AI开发者社区的发展。阿里云魔搭社区现已拥有4500个高质量开源模型,开发者数量超过500万。

然而,对于大模型是否需要开源,该领域的从业者也秉持不同态度。例如,有的认为大模型不但推理成本过高,而且黑箱特性也让普通开发者难以参与,这种情况下的开源并无意义。

对此,阿里云并不认同,其认为开源技术体系对全球技术领域的贡献毋庸置疑。

“作为全球唯一一家敢于全方位开源的云计算厂商,阿里云的最终目的是将AI技术全面地赋能给用户,让更多人能够在这样的模型体系上搭建创新应用。”周靖人表示,“而在大模型的潜力尚未得到充分挖掘的今天,我们希望以开放的心态开源最先进的技术,从而在产业和企业的创新发展中扮演重要角色。”

同时,他也指出,阿里云在开源最强模型的同时也在开发闭源模型,会基于开源和闭源的体系为客户提供全方位服务。

如此说来,对于大模型本身的发展而言,开源是否能够发挥良好的促进作用?

阿里云副总裁、公众沟通部总经理张启表示:“通义千问目前有十分活跃的开发者社区,每天都会给模型开发人员提供非常多有意义的反馈,很多甚至超出我们的设想。这也是为什么通义千问能够在一年时间内发展到中文性能赶超GPT-4 Turbo。”

“可以说,开源后吸收到的来自全球开发者的真实反馈,对模型发展本身意义重大。”张启继续说道。

升级百炼大模型平台,已为超9万家企业提供服务

在搭建生态的基础上,怎样才能让模型能力与真实业务场景有机融合,从而走向模型应用落地呢?阿里云希望百炼大模型平台能够发挥这一纽带作用。

本次会上,百炼大模型平台也迎来了新版本——2.0版本,不仅实现模型开发、应用开发和算力底座的全面升级,还引入足够多的模型选择,并率先兼容LlamaIndex等开源框架,以充分满足企业需求,让他们能以高性价比的方式使用模型。

打开网易新闻 查看精彩图片

(来源:资料图)

根据阿里云公布的最新数据,目前通义大模型已经服务超9万家企业,通义开源模型累计下载量突破700万。这些来自不同领域的企业,均基于通义大模型实现了业务效率的提升。

例如,中国一汽推出的大模型应用GPT-BI,已实现在财务、质保等领域的智能报表生成,并覆盖一汽研产供销等9大领域决策场景。西部机场集团上线AI助理“小西”,可提供创作生成、智能报表和知识问答等功能,旨在服务集团下辖陕、宁、青三省(区)的18个机场和1.8万名员工。

对于那些正在成长中的中小企业,阿里云也会借助百炼大模型平台为其提供核心帮助,比如直接调用基础模型、进行深度指令Prompt优化等。

而在赋能客户的过程中,阿里云也同样“被赋能”。正如周靖人所说,“很多企业在我们没有接触之前就使用了开源模型。正是因为模型的出色能力,让他们又再次找到我们。这种案例比比皆是,和我们的发展是相辅相成的”。

综上可以看出,持续优化模型、坚持构建生态,以及将模型能力与业务场景有机融合,是阿里云在大模型领域的三大发力方向。只有这样,才能在AI技术变革的时代中,帮助开发者和企业实现更多的大模型创新应用。