生成AI拿下3大顶会最佳！2025投稿新风向！|云计算费用|原理|实验|科研论文|算法

近两年，生成AI无疑是顶会宠儿！5月ICLR’24公布了杰出论文奖，纽大的扩散模型研究位列其中；6月CVPR’24公布了两篇最佳论文，也皆与生成AI有关；7月ICML’24最佳论文十篇里，SD3、Genie等基于扩散模型的生成创新同样获奖。

有一说一，图生视频这项功能本身在视频AI领域已不新奇，但难的是生成效果好，体验过后不难发现腾讯的开源视频生成模型HunyuanVideo可以称得上大模型的第一梯队。

为了帮助大家掌握混元视频生成大模型原理与本地部署，研梦非凡于3月27日晚（周四），邀请了大模型资深算法工程师张导师，独家详解《腾讯重磅开源HunyuanVideo,伟大无需多言》（AI前沿直播课NO.96），从现有开源生成模型回顾，重点讲解HunyuanVideo的算法研究、本地部署演示，1节课吃透HunyuanVideo架构原理，一节课get免费的国产Sora部署！

扫描二维码找助教0元预约直播课！

凡预约即可免费领取100篇扩散模型论文（43篇CVPR'25 最新收录）

直播课内容概览 01 论文背景

现有开源视频生成模型的不足及关键挑战
HuanyuanVideo的目标

02 HunyuanVideo的整体流程框架

HunyuanVideo数据预处理

数据过滤
数据标注

03 HunyuanVideo模型结构（重要）

3D Variational Auto-Encoder
统一图像与视频生成架构
核心组件（重要）

双流到单流 Transformer
3D 旋转位置编码（RoPE）
多尺度生成支持

文本编码器
Model Scaling

Image model scaling law
video model scaling law

04 HunyuanVideo模型预训练

图像预训练：两阶段渐进策略
视频 - 图像联合训练：多维度分桶策略
渐进式课程学习
图像 - 视频混合训练

05 HunyuanVideo模型加速 06 HunyuanVideo本地部署演示（重要）

扫描二维码找助教0元预约直播课！

凡预约即可免费领取100篇扩散模型论文（43篇CVPR'25 最新收录）

导师介绍

张老师

985高校硕士毕业，现在某上市公司担任高级算法工程师，在自动驾驶感知领域有超5年工作经验，熟练掌握python、pytorch。

对目标检测、目标跟踪、图像分割、点云、多模态、模型轻量化和部署方向有多年的项目经验。

研梦非凡可指导的研究方向

主流方向科研论文常用方法

研梦非凡现有idea

idea并不是直接拍脑门拍出来的，是一遍一遍实验、跑代码、改模型、思路修正的过程中产生的。研梦非凡1V1定制化论文指导，和研梦导师一起找idea，研梦导师指导实验，共同解决数据问题。授之以渔——搭建论文写作框架，增删改查，针对性实验指导！哪里薄弱补哪里！

全程1v1论文辅导扫码咨询助教

研梦非凡导师团队

研梦非凡的导师来自海外QStop50、国内华五、C9、985高校的教授/博士导师/博士后，世界500强公司算法工程师，以及国内外知名人工智能实验室研究员。

这是一支实力强大的高学历导师团队，在计算机科学、机器学习、深度学习等领域，积累了丰富的科研经历，研究成果也发表在国际各大顶级会议和期刊上，在指导学员的过程中，全程秉持初心，坚持手把手个性化带教。包括但不限于以下导师～～

<<< 左右滑动见更多 >>>

研梦非凡隶属于苏州研途教育，深耕考研辅导行业13年，累计服务1w+付费学员（60%高校学生/教师，40%职场精英）；科研为本，质量为先！我们有：500+ 国内外顶尖高校博士/教授，互联网大厂/独角兽公司的高级算法科学家组成的教师团队;深度定制的科研服务，根据每位学员的实际情况，提供个性化的科研辅导方案，确保交付结果;一站式、全方位科研支持，从选题到方案设计，从实验实施到论文撰写、成果发表，4V1全流程保姆式服务！