阿里“通义听悟”宣布升级：支持超长音视频问答，推出“高校公益计划”|公益计划|杨帆|翻译|通义听悟|阿里

3月19日上午，阿里大模型产品“通义听悟”发布多项新功能。音视频问答助手“小悟”上线，在业界首次实现单记录、跨记录、多语言自由问，支持对单个最长6小时、一次性上百条音视频的内容理解问答，用户可对超长音视频随心提问，让AI 总结任意知识点。

据通义听悟产品负责人杨帆介绍，通过多语言Query处理、长篇章文本理解、指令演化框架优化及检索增强生成算法，在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答，支持内容问答的音视频时长和文件数均突破业界上限。

用户不仅可在单一记录页呼唤小悟，对最高6小时、6G大小的音视频提问任何相关话题，或直接小悟要求整理金句、梳理结论、写会议纪要；更可在首页针对用户所有记录提问，支持一次性扫描理解上百条音视频内容；也可花式对英文视频用中文提问，小悟将直接给出中文回答，省去翻译。

此外，针对学习科研场景对AI工具的强烈需求，通义听悟推出“高校公益计划”。

所有中国大陆高校师生通过后缀edu.cn的教育邮箱认证后，均可直接免费获赠500小时音视频转写时长，存储空间从20G拓展至200G。

通过语音识别技术将音视频快速转为文本，也是许多高校学生日常学习科研的刚需功能。

音视频承载了密集的信息内容，但因涉及多模态理解、自然语言处理、搜索等多项复杂技术，长期以来内容查找难、回顾难、提炼难。阿里通义听悟产品负责人杨帆介绍，通义听悟为这一需求而生。“作为一款工作学习AI助手，通义听悟希望让高知识附加值的音视频被轻松阅读、整理和分享。”

针对用户需求，通义听悟还上线了一键AI改写、思维导图生成等新能力。例如，一键AI改写，将口语转为书面表达，尤其适合整理采访；思维导图自动生成，最多支持五级xmind脑图，适合播客摘要。同时，通义听悟还支持笔记插入视频时间戳及截图、自动识别音视频文件语种等细节体验升级。

通义听悟产品负责人杨帆表示，自2023年6月发布以来，通义听悟累计已有500万左右用户，目前通义听悟单日处理20万次音视频、处理12万小时数、处理字符数20亿字。

阿里“通义听悟”宣布升级：支持超长音视频问答，推出“高校公益计划”