南方财经全国两会报道组周潇枭 冉黎黎 北京报道3月4日,全国政协十四届四次会议在北京开幕。“人工智能+”已上升为国家战略,其深入推进正受到不少委员的关注,全国政协委员、九三学社中央常委、中国科学院院士李景虹便是其中一员。
李景虹注意到,当前,人工智能正在经历从“通用能力”向“专业赋能”演进的关键阶段。然而,在推进过程中,通用大模型由于缺乏对特定产业场景的深度理解,难以满足复杂、专业的行业需求,制约了“人工智能+”的实际效能。
具体而言,李景虹表示,一是公共资助科学数据开放共享水平有待提升。由财政资金支持产生的科研数据,是我国行业知识创新的重要源头。但目前,大量高质量科研数据沉淀在机构内部,开放共享机制不够健全,获取渠道不畅。二是关键行业基础数据积累不足,数据孤岛现象普遍。在化工、材料、生物医药等高度依赖专业数据的领域,我国长期依赖购买国外商业数据库,自身缺乏系统性的数据积累与标准化体系建设。三是高价值数据生成能力与基础设施短缺。对于流程工业、生物医药等需要实验验证的领域,高质量数据的产生高度依赖自动化实验室、数字孪生、高通量测试等专业设施。这类数据生成成本高、周期长,单纯依赖互联网公开数据或传统人工采集,难以满足模型训练对数据规模与精度的要求。当前,我国在上述数据生产型基础设施建设方面尚处于起步阶段,能力储备有待加强。四是场景数据回流机制不清晰,数据飞轮效应难以形成。
因而,李景虹建议从规划引领、设施建设、开放共享、规则明晰四个维度协同发力,构建支撑“人工智能+”纵深发展的行业数据生态。
其中,规划引领方面,以重点行业试点牵引高质量数据体系建设。建议优先选取生物医药、高端材料、精细化工、智能制造等数据价值密度高、智能化需求迫切的行业,开展“人工智能+行业数据”试点。针对每个试点行业,研究制定《行业高质量数据发展指南》,明确该领域高质量数据的定义标准、技术规范、关键缺失清单及阶段性建设目标。通过试点先行,形成可复制、可推广的经验,逐步构建覆盖重点行业的专业数据资源体系。
设施支撑方面,建设生产与共享数据的新型基础设施。一是布局行业级“数据工场”。设立专项资金,引导社会资本参与,支持行业龙头企业、国家级科研平台、高等院校联合建设一批自动化实验室、数字孪生平台、行业知识库等数据生产型基础设施。其核心任务是基于专业流程,系统性生成、标注、清洗和验证高价值行业数据,为模型训练提供源头活水。二是探索“共建共享池”机制。在试点行业内,由行业协会或第三方可信机构牵头,探索建立基于“贡献度评价与权益分配”的数据共享联盟。鼓励企业运用联邦学习、隐私计算等技术,在保障核心数据不出域、商业秘密不泄露的前提下,贡献脱敏数据用于公共模型训练,并共享模型能力提升带来的增值收益。三是推动央国企与公共机构数据开放。
同时,在李景虹看来,发展人工智能不能仅靠单点突破,而必须发挥教育在知识生产中的源头作用、科技在创新突破中的引领作用、人才在要素配置中的核心作用。“只有将三者置于同一改革框架下统筹推进,才能真正打通从基础研究到产业应用的价值链,形成具有全球竞争力的人工智能创新高地。”
因此,在强调夯实行业数据基础的同时,李景虹建议,在高校系统布局建设一批“AI+X”交叉学科与交叉学院,打破传统院系壁垒,推动人工智能与基础学科、工程学科、人文社科的深度融合。加快推进科研评价体系改革,减少对论文数量、项目层级、荣誉称号等显性指标的过度依赖,强化对研究成果的原创性、科学价值及其对产业发展的实际贡献的考察。同时,进一步破除制约产学研协同的制度藩篱,建立健全风险共担、利益共享的长效合作机制。支持由行业龙头企业和高水平研究型大学牵头,联合科研院所与产业链上下游企业,组建“新型创新联合体”,围绕人工智能赋能重点产业的共性技术难题开展联合攻关。
另外,在谈及我国科技创新时,李景虹对21世纪经济报道记者表示,从实验室的突破到产业化的落地,仍是科技创新发展必须攻克的瓶颈。面对这一转化瓶颈,强化企业创新主体地位至关重要,必须从制度上保障企业在创新决策、研发投入与成果转化中的核心作用,让企业真正成为打通创新链条、发展新质生产力的主导力量。
热门跟贴