打开网易新闻 查看精彩图片

新智元报道

编辑:Aeneas KingHZ

【新智元导读】谷歌Canvas免费上线了!现在,所有用户都可以使用Gemini 2.5 Pro的Canvas了,谷歌激情放言:我们的TPU炙手可热,正在火上浇油。

Gemini 2.5 Pro的Canvas,向所有人开放了!

AI大战,再次升级。

谷歌Gemini却表示:「我们的TPU热得发烫,而我们却要火上浇油。」

Gemini宣布:每个用户都可以使用Gemini 2.5 Pro的Canvas功能。

从提示到原型,只要几分钟,谁都可以使用Canvas进行编程和创新。

打开网易新闻 查看精彩图片

谷歌不装了,摊牌了:就是算力多,OpenAI不服来战!

谷歌搞突袭:Canvas免费

其实,上个周末,Gemini的Canvas功能已被发现,但需支付200美元。

打开网易新闻 查看精彩图片

这次的关键的在于,谷歌终于开窍了:好东西不必藏着掖着,只给收费用户或者在高门槛的AI Studio里使用,抢占用户心智才是大事!

此时,OpenAI的GPU在融化。谷歌乘机搞突袭:TPU随便烧,只要用户越多越好!

甚至谷歌CEO劈柴,在线教网友如何使用Canvas。

打开网易新闻 查看精彩图片

GeminI官方放出了4个使用Canvas的例子,并表示欢迎用户解锁更多玩儿法。

1.使用p5js设计一个万花筒

鼠标移动,可生成对称图案。

打开网易新闻 查看精彩图片

2.胡乱的涂鸦变钢琴曲

把写在草稿纸上的涂鸦拍成照片,Gemini能制作成一首简单有趣的钢琴曲!

打开网易新闻 查看精彩图片

3.创建简单的可玩街机游戏

创建一个简单的可玩街机游戏,控制屏幕底部的球拍,将球弹起并摧毁一排排的方块。

打开网易新闻 查看精彩图片

4.限时颜色匹配游戏

制作一个有时间限制和根据准确性计分的颜色匹配游戏。

打开网易新闻 查看精彩图片

在网页端Gemini,免费用户已可以使用Canvas功能。

选中底部Canvas功能,系统推荐了3个任务:编写登录页面,写巴黎游记以及写Python脚本,监控系统性能。

打开网易新闻 查看精彩图片

更多精彩示例

更多关于Canvas的惊艳演示如下。

1.绘制「无限猫」

打开网易新闻 查看精彩图片

2.创建并发布网络应用

打开网易新闻 查看精彩图片

3.视觉模拟

打开网易新闻 查看精彩图片

4.3D动图

打开网易新闻 查看精彩图片

5.旋转四维超立方体中的超球面

打开网易新闻 查看精彩图片

6.鹈鹕骑自行车

打开网易新闻 查看精彩图片

7.《小行星》游戏

打开网易新闻 查看精彩图片

8.创建动态Jujujajaki网络

打开网易新闻 查看精彩图片

9.AI成精了!

沃顿商学院教授Ethan Mollick,把著名的「Sparks of AGI」论文给Gemini 2.5,并提示:「阅读这篇论文,并通过在Canvas中编码展示你自己的最佳火花」。

它一次就制作了一个小工具,而其他模型没有完成这个任务。

打开网易新闻 查看精彩图片

Gemini产品负责人访谈:谷歌如何构建Gemini

就在最近,Gemini的产品负责人Tulsee Doshi的访谈也放了出来。

她为我们详细揭秘了,谷歌团队是如何构建Gemini 2.5 Pro的。

「氛围测试」打破大模型魔咒,火速刷榜

Gemini 2.5 Pro的强大推理和编程能力,已经毋庸置疑。

负责人确凿地表示,这是谷歌开发过的最强大的模型。

谷歌的想法是:「我们必须马上将它推出,马上让开发者马上用上它!」

尤为显著的,就是它的代码能力。

它特别擅长开发有趣的网络应用、AI智能体程序,还非常擅长代码编辑与转换,堪称理想的编程助手。

另外,它还继承了Gemini Pro的所有优势,具备多模态能力,能理解视频和图像。

更为独特的是,Gemini 2.5 Pro还打破了许多大模型面临的「魔咒」——

当一个模型在推理方面很出色时,往往在用户体验或氛围上表现不佳。

它不仅基准测试强,语言风格上也很出色,这就是为什么它能火速刷榜各大用户偏好相关的榜单。

这是因为,谷歌强调「氛围测试」(vibe check):模型不仅在技术上强大,还要在用户互动中自然、有趣、有用。

这种平衡,是通过精心的训练和评估实现的。

现在我们时常遇见的某种现象就是:当你不断优化某个随机指标时,其实并不符合用户对模型的真正期待。

而在Gemini 2.5 Pro上,谷歌真的做得很好。

2.5版本,也标志着模型范式的转变——

从此,所有Gemini模型都是「思考型」模型,思考能力,成为了它的核心特性。

代码能力提升:整个技术栈的合作

此前在AI界,一直有着「只有推理时计算才重要」的叙事。

而谷歌采用的团队合作,完全冲破了这种叙事。

比如为了提升代码能力,团队是从整个技术栈上优先考虑的——

从预训练角度,考虑的是什么样的数据对代码能力最重要;

从后训练角度,要考虑如何构建更好的网页应用;

从推理角度,就要研究如何帮助模型推理代码。

而在未来,Gemini模型还会继续向更智能、更高效的方向发展。

那时,开发者有希望能创建更复杂、更有用的应用程序。

参考资料:

https://x.com/i/status/1906867692901974436

https://x.com/GeminiApp/status/1906867703681273933

https://x.com/heyshrutimishra/status/1906992636223008919

https://x.com/Zoya_ai/status/1906959152980627628

https://blog.google/feed/gemini-new-model-podcast/