近两年,生成AI无疑是顶会宠儿!5月ICLR’24公布了杰出论文奖,纽大的扩散模型研究位列其中;6月CVPR’24公布了两篇最佳论文,也皆与生成AI有关;7月ICML’24最佳论文十篇里,SD3、Genie等基于扩散模型的生成创新同样获奖。

有一说一,图生视频这项功能本身在视频AI领域已不新奇,但难的是生成效果好,体验过后不难发现腾讯的开源视频生成模型HunyuanVideo可以称得上大模型的第一梯队。
为了帮助大家掌握混元视频生成大模型原理与本地部署,研梦非凡于3月27日晚(周四),邀请了大模型资深算法工程师张导师,独家详解《腾讯重磅开源HunyuanVideo,伟大无需多言》(AI前沿直播课NO.96),从现有开源生成模型回顾,重点讲解HunyuanVideo的算法研究、本地部署演示,1节课吃透HunyuanVideo架构原理,一节课get免费的国产Sora部署!
扫描二维码找助教0元预约直播课!
凡预约即可免费领取100篇扩散模型论文(43篇CVPR'25 最新收录)

直播课内容概览 01 论文背景
现有开源视频生成模型的不足及关键挑战
HuanyuanVideo的目标
HunyuanVideo数据预处理
数据过滤
数据标注
3D Variational Auto-Encoder
统一图像与视频生成架构
核心组件(重要)
双流到单流 Transformer
3D 旋转位置编码(RoPE)
多尺度生成支持
文本编码器
Model Scaling
Image model scaling law
video model scaling law
图像预训练:两阶段渐进策略
视频 - 图像联合训练:多维度分桶策略
渐进式课程学习
图像 - 视频混合训练
扫描二维码找助教0元预约直播课!
凡预约即可免费领取100篇扩散模型论文(43篇CVPR'25 最新收录)
导师介绍
张老师
985高校硕士毕业,现在某上市公司担任高级算法工程师,在自动驾驶感知领域有超5年工作经验,熟练掌握python、pytorch。
对目标检测、目标跟踪、图像分割、点云、多模态、模型轻量化和部署方向有多年的项目经验。
研梦非凡可指导的研究方向

主流方向科研论文常用方法

研梦非凡现有idea

idea并不是直接拍脑门拍出来的,是一遍一遍实验、跑代码、改模型、思路修正的过程中产生的。研梦非凡1V1定制化论文指导,和研梦导师一起找idea,研梦导师指导实验,共同解决数据问题。授之以渔——搭建论文写作框架,增删改查,针对性实验指导!哪里薄弱补哪里!

全程1v1论文辅导扫码咨询助教
研梦非凡导师团队
研梦非凡的导师来自海外QStop50、国内华五、C9、985高校的教授/博士导师/博士后,世界500强公司算法工程师,以及国内外知名人工智能实验室研究员。
这是一支实力强大的高学历导师团队,在计算机科学、机器学习、深度学习等领域,积累了丰富的科研经历,研究成果也发表在国际各大顶级会议和期刊上,在指导学员的过程中,全程秉持初心,坚持手把手个性化带教。包括但不限于以下导师~~




<<< 左右滑动见更多 >>>
研梦非凡隶属于苏州研途教育,深耕考研辅导行业13年,累计服务1w+付费学员(60%高校学生/教师,40%职场精英);科研为本,质量为先!我们有:500+ 国内外顶尖高校博士/教授,互联网大厂/独角兽公司的高级算法科学家组成的教师团队;深度定制的科研服务,根据每位学员的实际情况,提供个性化的科研辅导方案,确保交付结果;一站式、全方位科研支持,从选题到方案设计,从实验实施到论文撰写、成果发表,4V1全流程保姆式服务!

热门跟贴