第二期“人工智能应用大讲堂”系列活动——走进北京语言大学

打开网易新闻 查看精彩图片

为促进青少年了解科技发展的趋势和方向,掌握相关的技能,成为适应数字化时代的科技人才。6月21日,在北京市经济和信息化局的指导下,北京市科学技术协会的支持下,由北京软件和信息服务业协会主办,语言信息处理国家级实验教学示范中心(北京语言大学)和中国软件行业协会智能应用分会共同协办的第二期“人工智能应用大讲堂”系列活动在北京语言大学成功召开。“人工智能应用大讲堂”系列活动通过创新的“4+1”课程体系——四场专题科普活动和一场深度交流活动,旨在搭建一个展示人工智能前沿技术和发展方向的科普平台。活动通过线上线下结合的方式,邀请人工智能领域的权威专家、学者和成功企业家,就数据挖掘、算法训练、算力提升、落地应用以及伦理治理等关键议题进行分享和探讨。

“人工智能应用大讲堂”系列活动第二期聚焦人工智能之“内核”——数据,北京语言大学信息科学学院院长罗智勇教授出席活动并发表致辞,清华大学社会科学与国家治理实验室专职研究员傅建平,北京大学大数据分析与应用技术国家工程实验室特聘副研究员王娟,北京语言大学信息科学学院教授、副院长,大数据与知识工程研究所所长,全国高等院校计算机基础教育研究会文科专委会副主任委员李吉梅,滴普大模型研发技术总架构师冯森等嘉宾围绕数据生产、交易和应用等话题进行了深入的探讨和交流,让青少年理解和把握以人工智能、大数据为代表的新科技革命的脉搏。活动吸引了100余位来自高校、科研机构、人工智能相关企业的代表和热衷于人工智能学习的高校学生的现场踊跃参与,以及2535位收看线上直播的观众。

罗智勇教授在致辞中表示,北京语言大学是教育部直属的重点大学,信息科学学院作为校内唯一的理工科院系,其前身是国内第一批语言信息处理研究所之一。学院设有计算机科学与技术、人工智能、数据科学与大数据技术、数字媒体技术等热门专业,在语言信息处理方面具有鲜明特色,尤其在语言资源建设、语言智能、语言服务和语言教学等领域有所建树。例如,建立了全国最大的面向语言研究的全文语料库,以及面向语言教学、语言综合监测的语言资源监测平台。他表示,数据不仅是优质的生产要素,也是我国的战略信息资源,信息科学学院在语言大数据方面进行了一些探索,在此科普活动中,希望与专家、学生、教师和同仁们交流与合作,共同推动语言大数据领域的发展。

北京语言大学信息科学学院院长 罗智勇教授
打开网易新闻 查看精彩图片
北京语言大学信息科学学院院长 罗智勇教授

论人工智能之核心 话数据之未来

数据发展渐成燎原之势。如何优化数据配置并构建可持续数据发展生态,加速数据生产力的形成?在《驾驭数据要素化的几点思考》的主旨报告中,傅建平探讨了数据要素化的重要性,强调数据已成为国家战略资产和新型生产要素。随后,他提出了数据要素化发展中的“十大辩证关系”,包括供给与需求、公共与非公共数据、垄断与流通等等关系,以促进数据要素市场化配置。他强调了解放思想、提高数据质量和能力的重要性,以及构建可持续数据发展生态的必要性。同时指出了数据发展不平衡不充分的问题,并提出了通过政策牵引、创新应用和基础设施建设等措施来推动数据发展。最后,傅建平呼吁深化对数据要素化的认识,推动数据生产力的发展,以实现高质量发展。

清华大学社会科学与国家治理实验室专职研究员 傅建平
打开网易新闻 查看精彩图片
清华大学社会科学与国家治理实验室专职研究员 傅建平

目前,人工智能发展如火如荼,尤其是大语言模型技术风靡全球。那么,中国AI大模型数据集从哪里来?目前中文数据集存在哪些供给问题?你的数据价值超乎想象,但“它”真的属于你吗?数据交易和你我有关吗?个人如何参与个人数据收益分配?如何保护你的个人数据?在《数据要素市场对人工智能应用的重要性》的主题演讲中,王娟就以上问题做出了解答,她表示,我国是率先将数据定义为生产要素的国家,开启了数字经济时代数据基础制度和数据治理能力现代化发展序幕,旨在充分发挥我国海量数据规模和丰富应用场景优势,为人工智能领先全球发展保驾护航。这些是时代赋予我们的人生议题,她呼吁大家,要早一点主动思考,早一点付诸行动,就能早一点与时代共舞,参与创造属于我们的数字未来。

北京大学大数据分析与应用技术国家工程实验室特聘副研究员 王娟
打开网易新闻 查看精彩图片
北京大学大数据分析与应用技术国家工程实验室特聘副研究员 王娟

数据科学家认为世界的本质是数据,万事万物都可看作是数据流。据报道,2023年我国数据生产总量已达32.85泽字节(ZB)。在《从数据到大数据》的主题报告中,李吉梅教授深入浅出地从什么是数据、数据的生命周期、数据的价值讲起,着重分析了人工智能时代数据的“5V”(Volume,Variety,Velocity,Value,Veracity)特征。

北京语言大学信息科学学院教授、副院长,大数据与知识工程研究所
打开网易新闻 查看精彩图片
北京语言大学信息科学学院教授、副院长,大数据与知识工程研究所

大模型训练效果80%取决于数据加工后的质量。冯森在以《企业大模型之语料工程和模型工程落地之旅》的主题报告中通过分享滴普科技在企业大模型领域的实践,强调了语料工程和模型工程在构建高效AI智能应用中的关键作用。他介绍了滴普科技Data + AI产品Deepexi®数据智能基础设施,展示了如何通过多场景融合应用、DataOps面向大模型数据加工链路,LLMOps链路闭环、算力平台监控管理等手段,提升生产制造、供应链管理、商品运营等领域的智能化水平,冯森还详细阐述了模型训练、微调、推理和量化的工程方法,以及滴普科技与百丽、中国海诚等企业的合作案例,展示了如何通过自建昇腾AI训推平台,快速上线问答助手,设计助手和运营助手,提升知识问答效率,运营效率和设计效率,实现数据价值的探索与分析,推动企业智能化转型。

滴普大模型研发技术总架构师 冯森
打开网易新闻 查看精彩图片
滴普大模型研发技术总架构师 冯森

在精彩的主旨报告环节之后,现场参会的学生代表纷纷踊跃提问,就数据价值、模型训练、人工智能应用前景等问题与专家进行了深入的交流。

打开网易新闻 查看精彩图片

本次活动为北京语言大学的师生和企业代表带来了精彩纷呈的内容、前沿的理论知识、丰富的实践案例,有效拓宽了大家的认知边界。参会的学生们纷纷表示,这次活动使他们对人工智能和数据有了更深入的认识,培养了数据思维,点燃了他们对这一领域深入探究的热情,鼓舞他们今后更积极地投身于人工智能领域的学习和研究。

“人工智能应用大讲堂”系列活动不仅为与会者提供了丰富的知识盛宴,更为激发社会各界对人工智能科技潜力的认识和思考,共同探讨如何有效利用人工智能技术推动人类社会的发展和进步。

打开网易新闻 查看精彩图片