中国战略新兴产业融媒体记者 李子吉

北京,正在打造人工智能产业高地。

多个千亿参数基座大模型发布,全模拟光电智能计算芯片、量子云算力集群、第三代“香山”RISC-V开源高性能处理器核“北脑二号”智能脑机系统……在2024中关村论坛年会开幕式上,十项重大科技成果揭开面纱,其中人工智能相关成果数量占近一半。

北京是国内人工智能综合实力最强的城市。

人工智能相关企业2200余家,约占全国的四成;2023年,北京人工智能产业核心产值突破2500亿元,辐射产值规模超万亿元。当前,北京正加速深化人工智能大模型系统布局,向算力、数据等国际普遍共识的人工智能发展瓶颈进行突破。

01

AI重磅成果接连发布

4月27日,中关村论坛年会的“人工智能主题日”,这一天,有多场关于人工智能不同方向讨论的平行论坛,会场里人工智能应用更是随处可见。一进门,迎宾接待处站在“C位”的仿生机器人,可以借助大模型和大家进行自然语言的互动交流,问路、查询都能胜任;现场摆放的二维码,扫描后能看到可以对话问答的人工智能小助手。

由北京通用人工智能研究院研发的全球首个通用智能人“小女孩”——“通通”亮相,并入选了2024中关村论坛年会十大重大科技成果。“通通”是国际上首个具身通用人工智能系统原型,由“价值驱动”而非“数据驱动”。据测试,“通通”目前的表现与人类3岁到4岁儿童相当。

打开网易新闻 查看精彩图片

北京通用人工智能研究院先进技术中心副主任陈浩介绍道,它可以通过多模态交互,通过自己的探索和人之间的互动,能够增量地去学习一些新的知识和价值。它的难度首先在于它需要具备非常强大的视觉、语言、理解、推理、归纳、总结等能力。在这些能力的基础上,它才有可能发展出更高阶的实时在线学习的能力。

具体体现在:具备主动视觉的能力,能够主动巡视周围环境,通过主动照镜子构建自我模型,并实时生成、更新当前任务;通过观察、倾听交互对象,理解其动作和话语的意图,并基于价值映射的结果进行语言和动作的交互;拥有自我认知与他人认知能力:既能够理解和表达自身的固有状态,同时也能理解他人行为;实现价值规范下的人机互信,可以回答关于自身和他人行为背后的动机相关问题,推理和决策过程透明、具有可解释性。

“通通”的亮相为智能体的自主性、可解释性和价值对齐提供了新的解决方案。随着“通通”的持续迭代,可作为通用底座支撑各类垂直应用场景,形成千万个“通用智能人”赋能千行百业。同时“通通”也可以与具身智能机器人相结合,为智能制造、智慧城市、医疗健康等领域带来革命性的变化。

打开网易新闻 查看精彩图片

从2022年人工智能领域开始火爆的语言大模型ChatGPT,到今年年初出现的视频生成大模型Sora,“大模型”无疑成为当下科技行业的一个热门词语。

自Sora发布之后,“国产 Sora”的争夺战就打响了。但当行业都聚焦于“长”这一特性时,却都忽略了Sora的背后其实是综合效果的提升,例如长时序下的一致性、真实度、美观性等等。

4月27日上午,在2024中关村论坛年会未来人工智能先锋论坛上,生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型Vidu。Vidu不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点,这也是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。

从综合效果看,Vidu是首个也是唯一在效果层面全面对标Sora的视频模型,不仅仅在国内,在全球范围,也是继Sora之后首个完成突破的视频模型。Vidu画面效果非常接近Sora,在多镜头语言、时间和空间一致性、遵循物理规律等方面表现都非常出色,而且还能虚构出真实世界不存在的超现实主义画面,这是当前的视频生成模型难以实现的。

“Vidu是全栈自主创新的最新成果,在多个维度实现了技术突破,比如可以模拟真实的物理世界、具有想象力、可以理解多镜头语言、可以一键生成长达16秒的视频、人物场景时间具有高度一致性,还可以理解中国元素。”现场,清华大学人工智能研究院副院长、生数科技首席科学家朱军说道。

北京对大模型布局较早,是当前国内大模型创新基础最好、科研团队最为集中、技术实力最强、模型迭代最为活跃的地区。当前,大模型技术发展模式大致可分为通用大模型和行业大模型,其中,通用大模型的受众范围多为ToC,行业大模型多为ToB,但目前没有明确的界定,有可能根据实际需求动态变化。

打开网易新闻 查看精彩图片

在大模型的应用方面,北京近年来也有不少典型案例。

北京瑞莱智慧科技有限公司打造基于行业大模型的政策撰写助手,通过大模型辅助的政策撰写工具,帮助政策制定人员提升效率、扩大参考面、逐渐固化知识经验、提升规范性,从而最终提升政策的管理水平,促进政府治理流程优化和模式创新。面对效率痛点,引入政策检索、政策分析、政策撰写等自动化工具,辅助人员进行政策对比分析,政策撰写工作,大幅度提升工作效率;面对信息参考范围痛点,引入政策数据权威白名单,限定数据范围,政策撰写助手接入清洗、打标后、元信息完整的政策全量库并接入权威来源的新闻、政策解读、市场等信息数据。

北京蜜度信息技术有限公司推出文修大模型,该模型通过运用高质量数据学习多种特色子任务,使用千亿级token,通过对新闻政务领域和多领域公开文本的大规模自动学习,让机器发现典型的语言规律,实现对文本的智能校对处理,自动发现其中潜在的错别字、常识错误、时政表述差错等问题,能够更进一步提升中文校对和润色能力的智能化程度。

02

国内人工智能综合实力最强

北京市科委、中关村管委会信息科技处处长韩健在会上发布《北京市人工智能大模型行业应用分析报告》。他谈到,北京市AI大模型行业应用呈现五大特征:由浅入深,大模型穿越边缘场景,向核心场景挺进;守正创新,央国企拥抱新技术,加快大模型在产业升级、金融等领域的落地步伐;百花齐放,大模型应用搭建难度明显下降,“动态行业大数据”成为落地新关键;量体裁衣,需求方情况各异,在采购、部署大模型时特色鲜明;保驾护航,大模型安全逐渐受到重视,为可持续发展提供保障。

不只是大模型,人工智能企业总量、核心区域产业集聚能力、人工智能论文发表量、工信部“揭榜挂帅”优胜项目数量、人工智能顶尖人才数量等,北京均位居全国第一。不断突破的“第一”和“首位”,彰显了北京人工智能创新策源地优势得到持续巩固,源自于北京对人工智能产业的超前布局。

2023年5月,北京在国内率先出台人工智能专项新政《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》与《北京市促进通用人工智能创新发展的若干措施》,为人工智能技术创新与产业发展强优势、补短板。

“作为国内人工智能综合实力最强的城市,北京深化系统布局,推动产业集聚发展,构建完整产业链条,在国内率先出台了人工智能创新策源地实施方案和通用人工智能若干措施,加快构筑具有全球影响力的人工智能创新策源地。”北京市委常委、教育工委书记于英杰说。

日前发布的《北京市人工智能行业大模型创新应用白皮书(2023年)》显示:“北京是我国人工智能领域创新基础最好、人才资源最集中、研发创新能力最强、产品迭代最活跃的地区。”

国际数据公司IDC发布的《中国人工智能计算力发展评估报告》显示,从投资规模、政策力度、项目进展、技术成熟度、劳动供给等多维度考察,北京自2019年起连续霸榜、在国内遥遥领先。

2023年,北京人工智能产业核心产值突破2500亿元,辐射产值规模超万亿元,成为全国人工智能发展的领头羊。北京拥有人工智能领域6个全国重点实验室,以及视频与视觉技术、深度学习技术及应用等3个国家工程研究中心,形成集基础研究、人才培养、高层次学术交流等功能于一体的高水平科研基地。北京人工智能相关企业数量约2200家,全国40%人工智能企业聚集于此。2023年,人工智能领域融资总额约223亿元,约占全国四分之一。

创新指数是反映城市人工智能创新水平的重要指标,其创新城市指标模型包括4个一级指标:论文、学者、机构和国际合作。

具体而言,从论文指数的得分看,湾区第一,其次是北京和匹兹堡。湾区的论文数量有10432篇,论文平均被引量是201;北京的论文数量有 13211篇,是美国的1.27倍,而论文平均被引量为65,约为美国的1/3。

从国际合作指数看,北京超过湾区,以100分居第一,国际合作次数为6127;湾区得分98.44,国际合作次数为3734,约是北京的61%。

从学者指数的得分看,湾区仍居第一,北京第二,两者得分相差0.9。北京的学者数量有15044,是湾区的1.29倍;排名第三的剑桥,学者指数得分为90.36。从机构指数的得分看,湾区依然第一,其次是北京和纽约。湾区的机构有140个,机构平均被引量是16232;北京的机构有130个,与美国相差不多。

人才是重中之重。近年来北京把握数字经济发展大势,面对全球人工智能产业创新的激烈竞争,坚持人才引领,为人工智能产业发展注入源源不断的创新动能。数据显示,北京人工智能领域核心技术人才超4万人,占全国的60%。北京共有9所高校设立了人工智能学院或者研究院,占全国20%。

北京通用人工智能研究院院长朱松纯认为,通用人工智能已成为全球科技竞争的一个制高点。赢得这场科技竞争,必须走原创的技术路线,必须培养具有国际视野、家国情怀的人工智能顶尖人才。“近3年来,我们在北京大学、清华大学开设了通用人工智能实验班,聚集了国内一批优秀的年轻人。去年在教育部的支持下,有8所大学加入了通用人工智能博士联合培养计划。希望能够继续壮大人才尖兵队伍,打好关键核心技术攻坚战,在人工智能领域实现高水平科技自立自强。”

作为中关村论坛主办地,北京海淀区也将全面发力AI区域优势。

海淀区委常委、常务副区长岳立发布海淀人工智能创新街区概念。

据岳立介绍,人工智能创新街区位于海淀区南部,范围53平方公里,以“三横两纵一带”为骨架,串联37所顶尖高校、10个新型研发机构、52个全国重点实验室、106个国家级科研机构、1300家人工智能企业的科技成果,汇聚1.23万人工智能学者和89位AI 2000全球顶尖学者的智慧,人工智能创新街区将打造会学习、能思考、有温度、可进化的城市智能体。

据悉,在关键要素供给上,算力方面,海淀区正在积极打造北京AI公共算力平台,目前3500P的算力已经部署到位,计划到年底部署10000P算力;数据方面,海淀区正在积极推动北京AI模型语料中心建设,现在已经有1100TB高质量数据向大模型企业提供,同时还正在积极推进北京数据基础制度先行区建设。

人工智能领域,海淀区是全国人工智能创新基础最好、人才密度最高、研发能力最强、产品迭代最活跃的地区。例如大模型相关单位超90家且数量持续增长,备案大模型产品37款、占全市超七成,在全国率先形成人工智能大模型产业集聚区。

机器人领域,海淀区科研优势和产业优势突出,集聚清华、北大、北航、北理工、中科院等一批高校院所和专家人才,另一方面拥有近200家机器人企业,占全市40%,包括十余家人形机器人本体企业,占全市一半以上。

据悉,下一步,海淀区将率先在五道口和大钟寺两个先导区,打造智能体样板间,推动街区、校区、园区“三区”融合。

03

5年投资超1000亿

4月27日,在2024中关村论坛上,北京市发展改革委党组副书记、副主任林剑华发布了《北京市关于加快通用人工智能产业引领发展的若干措施》,并提出要强化产业基础研究,支持创新主体开展核心技术攻关,择优纳入市级科技研发计划,最高支持3000万元,对纳入国家重大战略任务的攻关项目,最高奖励1亿元。

该措施主要聚焦提升智能算力供给、强化产业基础研究、支撑高质量要素聚集、加快大模型创新应用、打造一流发展环境5大方面,提出10条措施。

具体来说,提升智能算力供给方面,对现有数据中心改建且智能算力规模达到1000P以上的绿色低碳智能算力中心,最高支持5000万元;统筹各级算力补贴,通过资金补贴、发放算力券、模型券等方式,降低大模型企业算力使用成本。

在模型方面,加强大模型关键核心技术攻关,支持创新主体通过“揭榜挂帅”“赛马”等方式开展关键核心技术攻关,择优纳入市级科技研发计划,最高支持3000万元,对纳入国家重大战略任务的攻关项目,最高1亿元。

在数据方面,鼓励各类主体开放共享高质量训练数据,根据数据开放数量和质量等予以最高300万元奖励;对于完成大模型训练数据产品交易的主体,予以最高200万元支持,推动政府、企业多方联动,促进数据合规使用。

在应用方面,推动应用场景对AI大模型的验证、迭代,围绕具身机器人、智能医疗、智能教育等重点领域,建设行业大模型应用场景联合研发平台,打造一批示范效应好、推广前景大、融合力度强的AI标杆应用,最高支持5000万元。

在环境方面,优化投融资环境,加大对拥有关键核心技术的高成长企业直投力度。建立AI投资联盟机制,协同社会资本和国家级基金提供持续保障,5年内投资超1000亿元。积极推动AI企业优先在北交所上市;以海淀区为核心,加快建设AI大模型产业集聚区,打造特色鲜明的AI创新创业街区,予以最高5000万元支持。

林剑华表示,要优化人工智能产业发展的投融资环境,加大对拥有关键核心技术的高成长企业直投力度,建立人工智能投资联盟机制,协同社会资本和国家级基金提供持续保障,5年内投资超1000亿元,积极推动人工智能核心企业优先在北交所上市。

编辑:李子吉

设计:李子吉

审核:艾丽

政审:王军善

终审:朱永旗