来源:市场资讯

(来源:VALSE)

报告时间

2026年4月15日 (星期三)

晚上20:00 (北京时间)

主 题

软硬协同优化:释放AI算法的极致潜能

主持人

晏轶超 (上海交通大学)

直播地址

https://live.bilibili.com/22300737

报告嘉宾:刘方鑫 (上海交通大学)

报告题目:大模型时代的“减法”艺术:从“被动响应”到“主动协同”的存算优化

报告嘉宾:赵进 (华中科技大学)

报告题目:多模态大模型推理优化技术研究

打开网易新闻 查看精彩图片

报告嘉宾:刘方鑫 (上海交通大学)

报告时间:2026年4月15日 (星期三)晚上20:00 (北京时间)

报告题目:大模型时代的“减法”艺术:从“被动响应”到“主动协同”的存算优化

报告人简介:

刘方鑫,上海交通大学计算机学院助理研究员、博士生导师,兼任上海期智研究院研究员。研究方向包括计算机体系架构、大模型加速、AI编译优化等。以第一/通讯作者身份在HPCA、ISCA、MICRO、ASPLOS、DAC等领域顶级期刊及会议上发表论文 60 余篇,其中CCF-A类40余篇,体系结构四大顶会20篇。主持国家自然科学基金青年项目、上海市自然科学基金面上项目,以及华为、阿里巴巴、蚂蚁金服、中兴通讯、小米、OPPO、CCF-蚂蚁科研基金、CAAI-蚂蚁科研基金等十余项企业及学会合作课题。曾入选上海交通大学首届“吴文俊人工智能博士项目”,并担任“国智班”项目导师。研究成果入选华为火花奖 (2022)、中国计算机学会容错计算专委40周年代表性成果等,此外,获ACM MM'25 系统杰出论文奖、ASP-DAC'26 LSI 设计比赛特别奖、DATE 2022最佳论文奖及最佳论文提名、上海市计算机学会优秀博士论文奖、ACM上海优秀博士论文奖、上海市优秀毕业生、CCF体系结构优秀博士论文提名等奖项与荣誉。指导学生获CCFSys图计算系统设计大赛特等奖、CCFSys 2025最佳项目海报奖及第二届集成芯片与芯粒技术开源社区大赛一等奖等荣誉。

个人主页:

https://mxhx7199.github.io/

报告摘要:

针对生成式 AI 带来的存算瓶颈,本报告分享了如何运用“减法”艺术,推动内存管理从“被动响应”迈向“主动协同”。我们认为:最好的内存优化,不是找到更多的空间存储数据,而是让数据以最精简的形态、在最合适的时间,出现在最需要的算力旁边。 基于这一理念,我们首先通过计算图驱动的全局调度与峰值平滑,化解了超大规模模型“存不下”的显存压力;其次,利用长文本特征压缩与信息感知预取,攻克了数据加载与专家切换带来的“传输慢”瓶颈;最后,通过对渲染算子的矩阵化重构,将非规则计算转化为高并行的矩阵模式,显著提升了新型负载在高并行计算单元如:Tensor Core 等核心上的计算利用率。为构建高效的 AI 算力底座提供了系统性的演进路径。

打开网易新闻 查看精彩图片

报告嘉宾:赵进 (华中科技大学)

报告时间:2026年4月15日 (星期三)晚上20:45 (北京时间)

报告题目:多模态大模型推理优化技术研究

报告人简介:

赵进,华中科技大学计算机学院副教授,2022年9月于华中科技大学获得博士学位,曾入选中国科协青年人才托举工程, CCF优秀博士学位论文激励计划和CCF体系结构优秀博士学位论文激励计划,主持国家自然科学青年基金、博士后特别资助 (站前)、CCF-蚂蚁科研基金、之江实验室青年基金等项目。研究方向包括计算机系统结构、图计算,相关成果已在ISCA、ASPLOS、MICRO、SC、PPoPP、Eurosys、DAC、ACM TACO等会议和期刊上发表学术论文40余篇,入选CCF A类期刊IEEE TC的Featured Paper of the Month等。

个人主页:

https://zjin-hust.github.io/

报告摘要:

针对多模态大模型推理中海量多模态词元带来的高昂 KV 缓存传输开销以及高模态编码成本导致的资源竞争激烈和服务质量难保证的问题,本报告分享一种面向多模态推理的服务系统,其通过模态感知的多层级KV缓存管理机制来最小化KV传输开销,并通过多模态输入感知的调度策略来保证高服务质量以及高资源利用率。

打开网易新闻 查看精彩图片

主持人:晏轶超 (上海交通大学)

主持人简介:

晏轶超,上海交通大学副教授,X-Human实验室负责人。主要研究方向为三维表征学习,发表高水平学术论文50余篇。主持国家自然科学基金青年/面上项目、上海市2025年度关键技术研发计划“新一代信息技术”项目、阿里、华为、字节等项目10余项。入选上海市海外高层次人才计划,获2025中国图象图形学学会科技进步二等奖,2024年中国图象图形学学会自然科学二等奖,2023挑战杯-揭榜挂帅专项赛特等奖。

个人主页:

https://daodaofr.github.io/

特别鸣谢本次Webinar主要组织者:

主办AC:黄维然 (上海交通大学)

协办AC:晏轶超 (上海交通大学)

活动参与方式

1、VALSE每周举行的Webinar活动依托B站直播平台进行,欢迎在B站搜索VALSE_Webinar关注我们!

直播地址:

https://live.bilibili.com/22300737;

历史视频观看地址:

https://space.bilibili.com/562085182/

3、VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。

4、您也可以通过访问VALSE主页:http://valser.org/ 直接查看Webinar活动信息。Webinar报告的PPT(经讲者允许后),会在VALSE官网更新。

看到这了,确定不关注下吗?关注下再走吧~