Scaling Law 遇瓶颈后下一个突破点在哪?多模态大模型会带来哪些革命性变革?从模型训练到推理部署的全流程技术挑战,都能在 2024 全球机器学习技术大会得到解答。
作者 | 《新程序员》编辑部
出品 | CSDN(ID:CSDNnews)
11 月 14-15 日,由 CSDN 联合高端 IT 咨询与教育平台 Boolan 举办的“2024 全球机器学习技术大会”在北京威斯汀酒店圆满落幕。大会汇聚了来自科技与人工智能领域的数十位顶尖专家以及上千名开发者和研究者,共同探讨大模型技术演进、多模态、GenAI 产品创新等前沿议题,为当下 AI 技术发展与应用提供了深刻洞察。
在大模型技术快速迭代的今天,产业界仍在不断探索更多可能。本次大会特别邀请了腾讯、阿里巴巴、字节跳动、百度、美团、小米、蚂蚁集团、eBay、快手、京东、金山办公、小红书、得物、昆仑万维、新浪微博、智谱AI、百川智能、澜舟科技、传神语联、昇腾、Dify.AI、Lepton AI 等知名科技企业,中国科学院、微软亚洲研究院、北京智源人工智能研究院等学术科研机构的技术大咖与专家学者,深入分享最新的技术突破与实践经验,为与会者带来了前沿的技术视角和落地方案。
大会现场气氛热烈,围绕 12 大专题深入探讨大模型技术创新、多模态突破、AI 基础设施建设等热点议题,共同探索人工智能的发展前沿。同时,「云会员」们也通过线上平台共享这场技术盛宴,为未来大模型技术及应用的创新实践注入了灵感。
Scaling Law 遇瓶颈、AI 幻觉仍未解决,全球机器学习技术大会破解大模型迷思!
从算法到应用,从技术突破到场景落地,大模型在这一年中取得了哪些具有里程碑意义的进展?11 月 14 日上午的主会场上,CSDN 高级副总裁、Boolan 首席技术专家李建忠,新加坡工程院院士、IEEE Fellow、昆仑万维荣誉顾问颜水成,传神语联创始人何恩培,新浪微博首席科学家、新技术研发负责人张俊林等重量级嘉宾,共同探讨了当前大模型技术面临的关键挑战与未来方向。
过去一年,大模型技术的演进呈现出鲜明特征:推理能力实现质的飞跃,多模态理解日益深入,训练范式开始变革。尤其值得关注的是,当 Scaling Law 遭遇瓶颈,业界已经开始探索新的技术路径,突破性进展正在重塑 AI 技术的发展轨迹。
与此同时,产业界也面临着严峻的现实挑战:大模型的“幻觉”问题始终悬而未决,如何确保推理的可靠性?在实际应用中,如何平衡通用能力与专业深度?欢迎回顾首日视频,寻找这些问题的答案:
大模型技术演进与应用创新洞察
李建忠 CSDN 高级副总裁、Boolan 首席技术专家
基础模型的根基
颜水成 新加坡工程院院士、IEEE Fellow、昆仑万维荣誉顾问
基于双网络架构的数推分离大模型探索与实践
何恩培 传神语联创始人
OpenAI o1 技术原理解析
张俊林 新浪微博首席科学家、新技术研发负责人
圆桌论坛:大模型未来之道
在本次主会压轴的圆桌对话环节中,CSDN 高级副总裁李建忠、Codeplay 技术副总裁 Michael Wong、传神语联副总裁蔺伟、新浪微博首席科学家和新技术研发负责人张俊林在 CSDN &《新程序员》执行总编唐小引的主持下,围绕“大模型的未来之道”展开深入探讨,共同探索大模型技术的发展方向与挑战。
详细报道:
12 大技术专题,深入大模型技术及应用实践!
从 Transformer 架构的效率优化到多模态技术的突破,从 AI Agent 的实践探索到企业级应用的深度落地,每一个技术创新都在重塑着开发范式。面对这波澎湃的技术浪潮,开发者们最关注的是:
如何突破现有大模型的技术瓶颈,开创超越 Scaling Law 的新范式?
多模态技术将走向何方,如何实现从单一模态到多模态智能的跨越?
大模型在工业界的落地实践该如何推进,技术创新如何转化为实际价值?
AI Agent 会给应用开发带来哪些革新机遇,智能体将如何重构人机交互范式?
本次大会汇聚了来自学术界和工业界的顶尖专家,围绕 12 大核心技术专题,深入探讨了大模型技术的前沿突破与未来方向。通过深度交流,与会者不仅领略了技术创新的无限可能,更获得了宝贵的实践经验与落地方案。
大语言模型技术演进
“GPT-4 以后,大模型还能继续遵循 Scaling Law 扩展吗?”这个问题在学术界和工业界引发了广泛讨论。从预训练模式的改进到架构设计的突破,从通用能力的提升到领域知识的深度融合,新的技术路径正在展现出令人期待的前景。本专题汇聚了来自百川智能、智源研究院、中国人民大学、中国石油大学、RWKV元始智能、北京交通大学等机构的顶尖专家,深入探讨了从理论突破到工程实践的全链路技术方案,为整个行业的发展提供了新的思路和方向。
Transformer 效率优化
王炳宁 百川智能预训练负责人
Infinity Instruct:合成指令技术的探索
刘广 智源基础数据研究组负责人
大模型机理分析
刘勇 中国人民大学高瓴人工智能学院副教授、博士生导师
大语言模型内涵知识边界的度量与油气行业知识的嵌入
吕仲琪 中国石油大学(北京)副教授、人工智能学院计算机系系主任
挑战 Transformer:RWKV 架构的探索与实践
林玥煜 RWKV元始智能算法工程 VP
从 3D 到 4D,快速且时空一致的 4D 内容生成探索
魏云超 北京交通大学计算机学院教授、副院长
尹雨阳 北京交通大学博士生
圆桌论坛:大模型系统技术实践
智源基础数据研究组负责人刘广、快手科技快意大模型知识增强研发负责人毛航宇、智谱 AI CodeGeeX 高级算法工程师张少博、Dify 首席架构师姜勇在 Boolan 首席咨询师李沫南的主持下,就大模型系统技术实践展开了深入探讨。
多模态大模型前沿
DALL·E 3、Midjourney V6、Sora 的横空出世,让世界见证了多模态技术的惊人潜力。但在这些耀眼成果背后,跨模态的深度理解、生成内容的质量控制、端到端系统的工程优化等挑战依然存在。在本专题中,来自腾讯、中科院、360、京东、潞晨科技等机构的顶尖专家带来了他们的探索与思考。从基础模型的架构设计到应用系统的工程实践,从视觉理解的算法突破到生成模型的性能优化,专家们的分享全面展现了多模态技术的发展现状和未来方向。
腾讯混元多模态技术实践
彭厚文 腾讯混元多模态模型负责人
多模态大模型的实践与思考
吴凌翔 中科院自动化所副研究员、武汉人工智能研究院算法总监
多模态大模型 LMM 与细粒度开放世界目标检测
冷大炜 360 人工智能研究院视觉方向负责人
多模态具身智能操作技能学习、交互探索与应用
李东江 京东探索研究院高级算法科学家
OPEN-SORA 高效低成本视频生成模型
卞正达 潞晨科技联合创始人、CTO
AI Agent
Adept 的 ACT-1 可以操作任意软件界面,AutoGPT 能够自主规划并执行长序列任务,Claude 3.5 Sonnet 更是在不久之前丢出了“AI 操控计算机”这一“王炸”——AI Agent 正以惊人的速度拓展着智能边界。从强化学习到大语言模型,从单体智能到多智能体协同,Agent 技术突破了传统 AI 系统的局限,展现出前所未有的应用潜力。本专题邀请到来自快手科技、小米、微软亚洲研究院等公司的技术专家,通过真实的工程实践案例,深入探讨了 AI Agent 在推理决策、任务规划、环境交互等方面的重要突破,展现了智能体技术在重构人机交互范式中的核心价值。
从强化学习(多)智能体到大语言模型(多)智能体
毛航宇 快手科技快意大模型知识增强研发负责人
小米在 AI Agent 上的思考和探索
高鹏至 小米大模型团队高级算法工程师
策略性推理与 AI 多智能体系统
毛绍光 微软亚洲研究院资深研发工程师
代码大模型与软件变革
2024 年初,“AI 程序员” Devin 成功让许多人重燃焦虑之火。到了年中,八岁女孩用 Cursor 编程的新闻更是惊呆了全球程序员的下巴。如今,AI 已不再仅仅是辅助编程的工具,而是成为了开发者的智能伙伴。本专题聚焦于当前广大工程师群体的灵魂之问,邀请到阿里云、智谱AI、字节跳动、百度、aiXcoder 等公司的技术专家,分享了他们在智能编程领域的深度实践。从代码生成的质量提升到开发流程的智能化重构,从编程助手的能力边界到端到端的智能开发实践,专家们的经验为我们展现了软件开发的未来图景。
AI 研发产品进化论:从 AI 编码助手到 AI 程序员
陈鑫 阿里云通义灵码技术负责人
基于 CodeGeeX 的 AI Coding 实践与探索
张少博 智谱AI CodeGeeX 高级算法工程师
豆包MarsCode,智能编程的探索实践
江波 字节跳动豆包MarsCode团队算法专家
大模型到智能体,软件研发流程变化了什么?
徐晓强 百度文心快码架构师
提升代码生成质量:代码大模型实践经验
蒋思源 aiXcoder 代码大模型算法专家
大模型应用落地实践
“大模型技术已进入深水区,谁能做出杀手级应用?”当这个问题在业界引发热议,一批企业已交出了令人瞩目的答卷。从企业级服务到消费者应用,从研发效能提升到业务流程重构,AI 的力量无处不在。本专题汇聚了来自腾讯、360、澜舟科技、小红书、eBay、京东、金山办公、商汤科技等企业的技术专家,他们分别从不同维度展现了大模型的实践之道:在企业服务领域,展示了从数据分析、知识管理到风险控制的全新解决方案;在研发效能方面,深入探讨了如何将大模型能力融入开发流程;在消费互联网领域,展现了从搜索引擎到生产力工具的突破性实践。
大语言模型在大数据研效场景中的智能化探索与实践
张功贯 腾讯平台智能技术架构师
文档理解及知识图谱增强大模型应用实践
刘焕勇 360 人工智能研究院知识图谱及文档理解算法方向负责人
构建企业高价值场景的 AI 应用:RAG、数值计算与推理的技术实践
马永亮 澜舟科技合伙人、算法和应用 VP
大模型在小红书搜索的应用
樊骏 小红书社区搜索算法工程师
LLM 在 eBay 风控 RCA 中的应用实践
刘威 eBay 高级技术专家
大模型应用落地的产品方案及最佳实践
赵建新 京东言犀产品技术总监
WPS AI 的技术探索与办公自动化
刘长波 金山办公算法总监、个人事业部 AI 与算法技术负责人
有用到好用:AI 生产力工具如何放大 AI 能力
张涛 商汤科技 Copilot 应用技术负责人
圆桌论坛:大模型应用创新实践
360 人工智能研究院知识图谱及文档理解算法方向负责人刘焕勇、通义实验室高级搜索算法专家丁瑞雪、中国石油大学(北京)副教授和人工智能学院计算机系系主任吕仲琪在 Athena labs CTO 王兴明的主持下,深入探讨了大模型应用创新实践。
大模型应用框架与工具
从构建一个企业级大模型应用,到实现一个可用的智能助手,我们究竟需要什么?这个问题困扰着每一位开发者。一站式开发平台、知识增强系统、分布式训练框架……技术工具的演进正在加速大模型落地的步伐。本专题邀请到了来自腾讯、Jina AI、Dify、通义实验室、蚂蚁集团、Percena、智源研究院等机构的专家,共同探讨从底层框架到上层应用的全栈实践。专家们不仅深入剖析了 RAG、知识图谱等关键技术的最新进展,更展示了大规模工程实践中的经验与思考,为开发者构建大模型应用提供了系统性的技术方案。
腾讯 Angel 大模型一站式平台工程实践
李夕瑞 腾讯 Angel 机器学习平台专家工程师
检索增强生成 RAG 的实践、挑战与发展
王楠 Jina AI 联合创始人兼 CTO
RAG 关键技术及未来趋势发展
姜勇 Dify 首席架构师
通义百炼 RAG 应用落地实践与挑战
丁瑞雪 通义实验室高级搜索算法专家
Graph+AI:立足 DB-GPT 社区探索 GraphRAG 未来架构
范志东 蚂蚁图计算开源负责人
薛明 Percena 创始人兼 CEO
RAG 2.0:记忆驱动的下一代检索增强系统
钱泓锦 智源研究院研究员
大模型架构与算力优化
「训练一个大模型动辄需要 6500 万美元。」这是 14 日主会上颜水成给出的数字。在模型规模持续增长的今天,算力效率已成为制约发展的瓶颈,训练提速 20-50% 就可能带来巨大的经济和环境效益。如何突破性能极限?如何实现更高效的部署?来自 CodePlay、昇腾、字节跳动、Lepton AI、得物、中科加禾、趋境科技等机构的专家,带来了从量化压缩到分布式推理的系统解决方案,展示了大模型优化的创新路径。
释放 AI 的潜能:应对变幻莫测的 AI 硬件和软件
Michael Wong CodePlay 技术副总裁
大模型推理加速的优化实践
张君 昇腾生态技术专家
AIGC 模型的量化和稀疏优化
刘松伟 字节跳动 ByteNN 团队高级工程师
生成式 AI 落地对架构带来的挑战与机遇
鱼哲 Lepton AI 创始成员
大模型推理性能提升实践
孟令公 得物机器学习高级专家
cutlass 跨平台编译优化实践分享
陈龙 中科加禾 CTO
Ktransformers:单卡完成千亿参数大模型推理任务
陈祥麟 趋境科技研发负责人
传神者大会:探索 AI 与文化传承的跨界融合
第七届传神者大会于 14 日下午与本届全球机器学习技术大会同期举行。作为国内少有的文化传播与数字创新交流融合的盛会,传神者大会目前已成功举办六届。过去几年中,传神者大会凝聚共同智慧,助力跨语言文化传播行业的发展与变革,国内外超百位行业领袖在此登台分享前瞻思想,每年吸引数十万观众和行业从业者的热烈讨论,传递最具突破性的成果和实践。在行业同仁和伙伴的支持下,传神者大会已发展成为跨语言文化传播领域重要的交流平台,持续为促进行业发展与变革,推动行业迭代升级加码助力。
本届传神者大会以“大语言模型与文化传承”为主题,邀请到人工智能学会副秘书长余有成、国际智库型咨询公司 Nimdzi lnsights 董事长 Renato Beninatto、CSDN 高级副总裁李建忠、中国信通院人工智能研究所安全治理部主任石霖、东方国信公司副总裁兼 CTO 查礼、传神语联创始人何恩培、中国国际图书贸易集团有限公司副总经理高晓强、北京语言大学副教授韩林涛等重量级嘉宾,共同探讨 AI 时代跨语言文化传播的创新与变革。
抓住机遇,守正创新:为国际传播技术赋能
余有成 人工智能学会副秘书长
大模型新纪元:全球视野下文化交融的璀璨新篇
Renato Beninatto 国际智库型咨询公司 Nimdzi lnsights 董事长
从生成到行动:大模型趋势与发展
李建忠 CSDN 高级副总裁
向 AI 要产能 向数据要安全
石霖 中国信通院人工智能研究所安全治理部主任
人工智能算力基础设施协同创新,助力 AI 原生开发能力构建
查礼 东方国信公司副总裁兼 CTO
以根原创大模型传文化之神韵
何恩培 传神语联创始人
从语言服务到国际传播,技术赋能下的价值聚合
高晓强 中国国际图书贸易集团有限公司副总经理、国际传播科技文化园管委会主任
人工智能时代如何培养对外文化传播“守门人”
韩林涛 北京语言大学副教授
圆桌论坛:《跨语言文化传播通往 AI 数智时代:硬币的两面性》
作为大会的压轴环节,由瞻胜传播 CEO 庞瑞主持,中央美术学院副教授吴小虎、中国搜索技术总监龙飞、新译科技创始人兼董事长田亮等业界专家围绕 AI 时代的跨语言文化传播展开了深入对话。近年来,AI 技术的浪潮席卷了各行各业,对跨语言文化传播领域的影响尤为显著,AI 正在重塑文本、图像、视频的每一个方面。面对“大模型快速迭代,给自己聚焦的领域带来最直观的感受是什么?要如何适应新挑战?”这一问题,嘉宾们从各自的视角出发,分享了他们的新见解、灵感以及成功案例,不仅为参会者提供了宝贵的思考方向,也为大会画上了圆满的句号。
开发者云集,现场人头攒动
2024 全球机器学习技术大会的成功举办既离不开所有行业专家们的干货输出和 AI 开发者们的热情参与,同样也离不开合作伙伴们的鼎力相助。特别感谢传神语联、昇腾、快递100、人民邮电出版社异步社区、电子工业出版社博文视点、清华大学出版社、机械工业出版社、人民邮电出版社图灵文化的大力支持。
在这两天的技术盛宴中,来自全球的开发者与研究者齐聚一堂,共同探讨 AI 技术的前沿突破。各位专家不仅深入剖析了大模型技术的最新进展,更分享了宝贵的工程实践经验。从 Scaling Law 的演进到多模态技术的突破,从 AI Agent 的探索到企业级应用的落地,每一个议题都引发了与会者的热烈讨论与思考。
专家们的真知灼见为开发者们指明了技术创新的方向:大模型技术正在经历从简单的尺度扩展到架构创新的关键转折,多模态能力的提升正在为 AI 应用开启新的可能,而工程化实践的深度探索则为技术落地提供了切实可行的方案。这些洞察对于每一位致力于 AI 技术创新的开发者都具有重要的指导意义。
年末盛典:2024 全球 C++ 及系统软件技术大会
至此,2024 全球机器学习技术大会圆满落幕。随着大模型技术不断突破、算力需求持续攀升,底层系统软件的支撑作用也愈发重要。为了进一步探讨现代系统软件的创新路径,2024 全球 C++ 及系统软件技术大会将于 12 月 6-7 日在上海隆重召开。C++ 之父、ACM 和 IEEE 院士 Bjarne Stroustrup 等重量级嘉宾将发表演讲,会上更将围绕现代 C++ 最佳实践、AI 算力优化、高性能计算等九大主题展开深入探讨。从 AI 应用到底层技术,从机器学习到系统软件,CSDN 正带领开发者们在技术创新的道路上不断前行。诚挚邀请各位开发者莅临现场,与全球顶级专家共同探讨技术革新,谱写软件技术发展新篇章。
详情阅读:
热门跟贴