OpenAI最近向部分客户展示了一款新型多模态人工智能模型,该模型能够进行语音对话和物体识别。有消息人士透露,这或许就是OpenAI计划在5月13日正式发布的内容之一。报道称,相比于OpenAI现有的独立图像识别和文本转语音模型,该新型模型能够更快、更准确地处理图像和音频信息。理论上,该模型还能辅助学生学习数学知识,或翻译现实世界中的标志文字。不过,消息人士也指出,虽然该模型在某些问题解答方面能够超越GPT-4 Turbo,但仍有可能出现自信地给出错误答案的情况。(IT之家)