手机人工智能为何未让我心服？改变在何处|人工智能|应用程序|智能手机|谷歌

如果像三星、谷歌和苹果这样的手机制造商的话可信，人工智能将改变我们使用移动设备的方式。问题是：何时？

今年，一波人工智能驱动的功能出现在了我们的手机上，从用于重写消息的工具到无需离开消息应用程序即可翻译文本。得益于生成式人工智能，您只需快速滑动几下，就可以从照片中删除对象，或者根据简单的提示或粗略的绘图生成精美的图像。

虽然这些更新可以说为您的手机带来了更多便利，但它们并不像科技巨头让您相信的那样具有开创性。以人工智能为核心的手机功能的第一阶段是为非常特定的用例而设计的——实际上非常具体，以至于我经常忘记使用它们。感觉最有前途的新功能，如谷歌的“Circle to Search”和苹果的“Visual Intelligence”，要求用户以不同的方式思考如何在手机上进行操作，这带来了一系列挑战。

可以肯定的是，科技公司已经明确表示，这是移动软件多年发展的开始。做好这件事至关重要，因为有一种观点认为，生成式人工智能将定义互联网的未来以及我们获取信息的方式。据说，生成式人工智能在美国的采用速度比个人电脑和互联网的采用速度更快。如果科技公司不将生成式人工智能纳入其设备，就有可能被甩在后面——就像那些在 21 世纪初错过向智能手机转型的公司一样。

到目前为止，我们已经看到了智能手机软件未来走向的一些迹象，出现了一些新颖的想法，比如不太依赖应用程序的手机界面和可以代表您行事的人工智能代理。就目前而言，那些想法也就仅此而已，但我希望在 2025 年看到推动手机朝这些方向发展的举措。

2024 年的人工智能功能微不足道，并非必不可少

生成式人工智能，即根据提示创建内容或响应的人工智能，在 2023 年引起了全世界的关注，这在很大程度上要归功于 ChatGPT。但 2024 年是手机制造商开始认真采用该技术的一年。三星在 1 月份推出了 Galaxy AI 拉开了序幕，而苹果在 6 月份推出了 Apple Intelligence，并在 10 月份推出前的几个月里。谷歌在 2024 年期间零星地宣布了人工智能的进步，从 5 月份在 Google I/O 大会上的 Gemini Live 和 Gemini 能够理解您手机屏幕上的内容到 8 月份 Pixel 9 系列上的新图像生成工具。

这些早期的众多功能旨在解决我不确定是否需要解决的问题。例如，我很少发现自己处于需要重写短信以让其听起来更专业或友好的情况。我发短信的大多数人是亲密的朋友或家庭成员，所以我通常不会太仔细考虑措辞或语气。在极少数情况下，当我给与工作相关的联系人发短信时，对话通常只是关于即将到来的会议或活动的简短提醒。

其他新的人工智能功能有趣且令人印象深刻，但未能证明其长期有用性。三星在 Galaxy Z Fold 6 和 Z Flip 6 上推出的 Portrait Studio 立马浮现在脑海中。它使用人工智能将人物照片重塑为不同的艺术风格，如水彩画或卡通。

七月我刚拿到 Galaxy Z Fold 6 的时候，我玩不同的自拍照和朋友的照片玩得特别开心，想看看三星会怎样以新形象重新构想我们。但这新奇感很快就消失了。从那以后我就再没碰过那个功能，甚至三个月后再次查看 Z Fold 6 也是如此。

对于其他图像生成应用程序和功能，比如 Pixel 9 的 Pixel Studio（它能依据提示创建图像）以及三星用于把草图变成详细图像的 Sketch-to-image 工具，我的感觉是一样的。我承认，摆弄这些创意工具，看看它们能有啥效果，是有一定的乐趣。但几个月后，这些功能在我的日常生活中还没有找到一席之地。

苹果也刚刚推出了自家名为Image Playground的图像创建应用程序的预览版，这是iOS 18.2 开发者测试版的一部分。我还没在这上面花足够的时间来形成一个印象，但我没法想象我会有很不一样的感觉。

当然，我的经历并不能反映每个人的观点。有些人可能会觉得这些工具很有价值，比如那些在社交场合中感到吃力、需要一些额外帮助来弄明白怎么编写短信的人。或者是那些需要为个人项目快速即时创建图像的创意人员。但这正是我的观点；这些功能似乎是为特定情况而设计的，而不是推动移动体验全面向前发展的全面变革。

迄今为止最有前景的功能为未来奠定了基础

虽然绝大多数新的人工智能功能让人感觉无关紧要，但有一些却展现出了真正的潜力。

谷歌的‘圈选搜索’（Circle to Search）便是这样一个例子，它能让您通过圈选手机屏幕上几乎任何内容来启动谷歌搜索。

苹果iPhone 16的视觉智能模式以及苹果智能中的消息和通知摘要也是这样。

这些功能与上述其他功能的区别在于，它们在系统层面给人的感觉更加集成，而非隐藏在特定的应用程序里。

但更重要的是，它们旨在解决我们使用手机时的一些更重大的问题，即便它们目前尚未完全达成这一目标。

‘圈选搜索’和视觉智能是这方面最有力的两个例证。

表面上它们看起来可能大不相同——‘圈选搜索’利用了手机屏幕上的内容，而视觉智能则要求您使用 iPhone 16 的摄像头去扫描周围的世界。

但它们的目的都是省去必须打开应用程序、启动谷歌搜索或者在 ChatGPT 中输入提示来检索信息的中间步骤。

苹果智能的消息和通知摘要也是一个有时让人感觉真正有用且无需用户额外费力的人工智能功能的例子。

与‘圈选搜索’和视觉智能一样，它给人的感觉像是针对一个非常常见的问题所做出的全面变革：管理我们移动设备上涌入的信息。

但即便像这样的功能也远非完美，还有很长的路要走。苹果的总结有时足以让我知晓文本线程的要点，但更多时候，它们缺失关键的上下文信息。视觉智能仍处于预览阶段，是 iOS 18.2 开发者测试版的一部分，所以我仍在感受它的实用性。

除此之外，视觉智能和环形搜索都面临着同样的难题：经过多年习惯点击、滑动和滚动的操作，在我们的手机上采用新的操作方式并非自然而然。在屏幕上画个圈，或者启动 iPhone 的相机而非打开谷歌，目前都还不是本能性的操作，谁知道这种情况是否会改变以及何时改变。

在 2024 年变得清晰的是，人工智能在我们的智能手机上仍需证明其用途。人工智能的潜力开始显现，特别是当您考虑到有关我们的手机如何改变的更具戏剧性的构想时，比如谷歌 I/O 上的Project Astra 演示、高通的概念，也就是应用程序能够为您采取行动，以及 Brain.ai 有关手机能够按需生成其界面的愿景。目前已经有很多努力正在进行，以让手机更直观，比如谷歌的 Gemini 扩展，它能让数字助手与其他应用程序协同工作，以及苹果升级后的 Siri，它能够理解个人上下文。

我们是否会放弃应用程序而青睐人工智能，或者依靠虚拟代理来完成日常任务，这无法确定。但这不是我在 2025 年所期待的。目前，我只想要那些感觉比我们迄今所见到的更实用、有用且创新的功能。