打开网易新闻 查看精彩图片

刚刚,OpenAI发布会重磅举行,我只能用震惊来说了,如果你看过科幻电影her ,相信你对这次发布会的情节不会陌生,OpenAI推出了新模型:

GPT-4o(o指的是全能)

GPT4o(OmniModel)可以实时进行文本、音频和视频推理。ChatGPT也有了新的UI‍‍‍‍‍‍‍‍‍

打开网易新闻 查看精彩图片

它用途极其广泛,玩起来很有趣,并且朝着更自然的人机交互(甚至人机-计算机交互)形式迈出了一步:

opencat第一时间带来报道‍‍

快速笔记:

1. 发布全新先进模型GPT4o(o:语音,视觉,文字):全球免费使用,‍‍GPT-4o 就是之前在在 LMSys 竞技场上测试了一个版本

即 im-also-a-good-gpt2-chatbot

下面是测试结果

打开网易新闻 查看精彩图片

牛P啊,遥遥领先...

GPT-4o API 比 GPT4-turbo 快 2 倍,价格便宜 50%!

打开网易新闻 查看精彩图片

2.强大实时交互的语音聊天,几乎没有延迟,可以随时打断,就像电影her中人工智能一样,这简直太疯狂了(OpenAI的演示中声音竟然也比较像电影her中斯嘉丽约翰逊),可以模仿人,可以唱歌,该模型可以理解音频和视频,甚至可以检测出声音中的情绪,可以实时进行翻译‍‍‍‍

整个发布会非常短,下面是完整视频,看视频感觉会更强烈

 超级核弹!OpenAI 再一次改变世界,电影her中人工智能变成现实「科幻走进现实」
打开网易新闻 查看更多视频
超级核弹!OpenAI 再一次改变世界,电影her中人工智能变成现实「科幻走进现实」

视频翻译是Google直译的,有错误,将就看,哈哈,时间太紧了‍‍

结语

GPT-4o 的文本和图像功能今天开始在 ChatGPT 中推出

将在免费版中提供 GPT-4o,并为 Plus 用户提供高达 5 倍的消息限制‍

将在未来几周内在 ChatGPT Plus 中推出带有 GPT-4o 的 Voice Mode 的新版本。

开发者现在也可以通过 API 访问 GPT-4o 作为文本和视觉模型‍