近两年,生成AI无疑是顶会宠儿!5月ICLR’24公布了杰出论文奖,纽大的扩散模型研究位列其中;6月CVPR’24公布了两篇最佳论文,也皆与生成AI有关;7月ICML’24最佳论文十篇里,SD3、Genie等基于扩散模型的生成创新同样获奖。

打开网易新闻 查看精彩图片

有一说一,图生视频这项功能本身在视频AI领域已不新奇,但难的是生成效果好,体验过后不难发现腾讯的开源视频生成模型HunyuanVideo可以称得上大模型的第一梯队。

为了帮助大家掌握混元视频生成大模型原理与本地部署,研梦非凡于3月27日晚(周四),邀请了大模型资深算法工程师张导师,独家详解腾讯重磅开源HunyuanVideo,伟大无需多言》(AI前沿直播课NO.96),从现有开源生成模型回顾,重点讲解HunyuanVideo的算法研究、本地部署演示,1节课吃透HunyuanVideo架构原理,一节课get免费的国产Sora部署!

扫描二维码找助教0元预约直播课!

凡预约即可免费领取100篇扩散模型论文(43篇CVPR'25 最新收录

打开网易新闻 查看精彩图片

直播课内容概览 01 论文背景

  1. 现有开源视频生成模型的不足及关键挑战

  2. HuanyuanVideo的目标

02 HunyuanVideo的整体流程框架
  1. HunyuanVideo数据预处理

  • 数据过滤

  • 数据标注

03 HunyuanVideo模型结构(重要)
  1. 3D Variational Auto-Encoder

  2. 统一图像与视频生成架构

  3. 核心组件(重要)

  • 双流到单流 Transformer

  • 3D 旋转位置编码(RoPE)

  • 多尺度生成支持

  1. 文本编码器

  2. Model Scaling

  • Image model scaling law

  • video model scaling law

04 HunyuanVideo模型预训练
  1. 图像预训练:两阶段渐进策略

  2. 视频 - 图像联合训练:多维度分桶策略

  3. 渐进式课程学习

  4. 图像 - 视频混合训练

05 HunyuanVideo模型加速 06 HunyuanVideo本地部署演示(重要)

扫描二维码找助教0元预约直播课!

凡预约即可免费领取100篇扩散模型论文(43篇CVPR'25 最新收录

导师介绍

张老师

985高校硕士毕业,现在某上市公司担任高级算法工程师,在自动驾驶感知领域有超5年工作经验,熟练掌握python、pytorch。

对目标检测、目标跟踪、图像分割、点云、多模态、模型轻量化和部署方向有多年的项目经验。

研梦非凡可指导的研究方向

打开网易新闻 查看精彩图片

主流方向科研论文常用方法

打开网易新闻 查看精彩图片

研梦非凡现有idea

研梦非凡科研论文指导方案
打开网易新闻 查看精彩图片
研梦非凡科研论文指导方案

idea并不是直接拍脑门拍出来的,是一遍一遍实验、跑代码、改模型、思路修正的过程中产生的。研梦非凡1V1定制化论文指导,和研梦导师一起找idea,研梦导师指导实验,共同解决数据问题。授之以渔——搭建论文写作框架,增删改查,针对性实验指导!哪里薄弱补哪里!

打开网易新闻 查看精彩图片

全程1v1论文辅导扫码咨询助教

研梦非凡导师团队

研梦非凡的导师来自海外QStop50、国内华五、C9、985高校的教授/博士导师/博士后,世界500强公司算法工程师,以及国内外知名人工智能实验室研究员。

这是一支实力强大的高学历导师团队,在计算机科学、机器学习、深度学习等领域,积累了丰富的科研经历,研究成果也发表在国际各大顶级会议和期刊上,在指导学员的过程中,全程秉持初心,坚持手把手个性化带教。包括但不限于以下导师~~

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

<<< 左右滑动见更多 >>>

研梦非凡隶属于苏州研途教育,深耕考研辅导行业13年,累计服务1w+付费学员(60%高校学生/教师,40%职场精英);科研为本,质量为先!我们有:500+ 国内外顶尖高校博士/教授,互联网大厂/独角兽公司的高级算法科学家组成的教师团队;深度定制的科研服务,根据每位学员的实际情况,提供个性化的科研辅导方案,确保交付结果;一站式、全方位科研支持,从选题到方案设计,从实验实施到论文撰写、成果发表,4V1全流程保姆式服务!

打开网易新闻 查看精彩图片