12月18日,字节跳动正式推出了其最新的豆包视觉理解模型。据官方介绍,该模型在处理千tokens输入时的价格仅为3厘,这意味着用户仅需一元钱即可处理多达284张720P分辨率的图片。

值得注意的是,这一价格相比行业平均水平便宜了85%,极大地降低了企业应用多模态大模型的门槛和成本。

打开网易新闻 查看精彩图片

事实上,多模态大模型作为当前人工智能领域的前沿技术,能够同时处理和理解文本、图像、视频等多种类型的数据,对于提升企业智能化水平、优化业务流程具有重要意义。然而,高昂的处理成本一直是制约其广泛应用的关键因素之一。

据介绍,豆包视觉理解模型模型依托字节跳动强大的算法和算力支持,能够快速准确地完成图像识别、理解等任务,为企业用户提供高效、稳定的视觉理解服务。(青山)