关注CAIE,国内头部AI人才认证、培训体系,助你在职场升职加薪。
今天凌晨,谷歌毫无预兆地扔了个重磅炸弹Gemini 3.1 Pro。
这次Gemini 3.1 Pro最核心的性能提升,就是推理能力,也就是智商。
有个叫ARC-AGI-2的测试,这玩意被称为AI界的智商检测器,专门考那种从未见过的逻辑题,防刷题、防作弊,难度极高。
谷歌CEO 劈材哥表示,Gemini 3.1 Pro考了77.1分,而之前的Gemini 3 Pro才考了31.1分,直接提升了2倍,真正博士级AI终于来了。
可能有朋友会说,测试分数再高有啥用呢?其实不然,这些测试分数背后,反映的就是它处理实际复杂任务的能力。
比如咱们平时整理多份杂乱的数据,需要从中找规律、做总结,以前的AI可能只能给你罗列信息。
现在能直接帮你整合好,甚至帮你分析出关键结论。再比如做编程、设计之类的活儿,能更快get到你的需求,少走很多弯路。
除了智商能力,Gemini 3.1 Pro其他测试也相当能打。专业科学知识测试里,它考了94.3分,接近满分,也就是说不管是科研相关的问题,还是咱们平时遇到的专业知识点,它都能给你讲得明明白白。
编程测试里,国际程序设计竞赛的题目,它的埃洛评分达到了2887,比上一代高了400多分,相当于一个普通程序员和一个资深程序员的差距,写代码的效率和准确率都提升了不少。
还有长文本检索,平均12.8万字符的上下文,它能精准找到你要的信息,准确率84.9%,平时看长篇论文、大篇幅资料,用它来检索重点,能省不少时间。
聊完理论上的提升,再跟大家说点实际能用得上的场景。
第一个是代码化动画制作,平时咱们做个网站、剪个视频,想要个好看的动画,要么找现成的素材,要么自己写复杂的代码,特别麻烦。
而Gemini 3.1 Pro不一样,你只要用文字跟它说清楚你想要什么样的动画,比如“一个简约的圆形旋转动画,适合放在网站首页”,它就能直接生成SVG格式的代码。
这种代码做出来的动画,不管放大多少倍都不会模糊,而且文件很小,不会拖慢网站速度。
然后是复杂系统整合,这个可能企业用户用得多一些。简单来说,它能把那些复杂的API接口和咱们能看懂的设计界面打通,不用你懂太多专业技术,就能实现复杂的功能。
有一个让我印象特别深的案例,居然能搞定国际空间站的实时轨道仪表盘。这听起来挺玄乎,其实就是要从一堆复杂的公共遥测数据流里抓信息,然后变成咱们能看懂的图表。
以前这可是得把航天数据和编程接口对接得天衣无缝才行,现在模型自己就能推理出来,把复杂的API接口变成了直观的用户界面。
这就像是一个不需要培训就能上手的顶级工程师,直接帮你搞定了最难搞的数据对接工作。
再说说它的交互设计能力,看那个椋鸟群飞的模拟我就惊了。它不仅仅是写个3D飞行代码那么简单,它甚至考虑到了交互性。
你可以用手势去控制鸟群,而且背景音乐还是根据鸟群飞行的节奏生成的。
这种把视觉、听觉和控制逻辑一锅端的创造力,以前得一个团队配合才能搞定,现在一个人加个AI就能闭环。这种沉浸式的体验设计,对搞艺术或者做原型的朋友来说,想象力空间太大了。
还有一个特别有意思的功能,让它读《呼啸山庄》,然后做一个个人作品集网站。它没像以前的AI那样只会摘抄好词好句,而是真的读懂了那种阴郁又热烈的气氛,设计出了一个既现代又符合原著灵魂的界面。
这种对抽象意境的理解和落地能力,真的让人感觉AI开始有了点所谓的艺术直觉。
从现在开始,就能在Google AI Studio、Vertex AI这些平台上找到预览版。
咱们普通用户更简单,直接去Gemini App或者NotebookLM就能体验。特别是订阅了Google AI Pro或者Ultra的高级用户,额度会更高,玩起来更爽。
想转型AI,不被时代淘汰
CAIE注册人工智能工程师认证
岗位能力 × AI工具 ×转型方向 × 场景落地 = 新AI职业价值
扫码免费领取《AI工程师入门学习指南》