VITA,是一个由南京大学腾讯共同开源的交互式多模态大型语言模型,VITA-1.5 在实时视觉和语音交互方面达到了接近 GPT-4o 水平的性能,支持中英文。 地址: 网页链接 林亦LYi的微博视频