谷歌Gemini音箱复活"连续对话"：老功能新瓶装|语音助手功能|谷歌gemini|连续对话|音箱

你刚问完"明天会下雨吗"，紧接着追问"那适合跑步吗"——音箱却装死，逼你重新喊一遍唤醒词。这种断裂感，谷歌现在说要治了。

场景代入：一个被唤醒词折磨的日常

凌晨六点，厨房。你双手沾着面粉，想查个菜谱。

"嘿，谷歌，番茄炒蛋怎么做？"

"以下是番茄炒蛋的做法……"

"需要放糖吗？"

——沉默。音箱已经进入休眠，等你再次喊它。

这个场景每天都在全球数千万台智能音箱上重演。谷歌4月22日宣布，Gemini for Home将重新上线"连续对话"（Continued Conversations）功能，试图终结这种尴尬。

但讽刺的是，这根本不是新功能。Google Assistant时代，这项能力已经存在多年。现在Gemini版本只是"复活"而非"发明"。

清单一：Gemini版连续对话的三处"升级"

谷歌官方给出了新旧版本的差异点，我们逐条拆解：

① 上下文记忆

旧版Google Assistant的连续对话，本质是多轮指令的机械拼接。新版Gemini号称能"追踪先前对话"，这意味着它可能理解指代消解——比如你问完"北京天气"再问"那上海呢"，它知道"那"指代天气。

但原文的表述很克制：better contextual responses since it can keep track of your prior conversations。没有承诺理解深度，只说了"更好"。

② 语言覆盖

原版功能支持的语言有限，Gemini版本扩展了语言支持。具体哪些语言？原文没列清单。对于中文用户，这反而是关键悬念——Gemini的中文多轮对话能力是否追平了国内竞品？

③ 抗干扰能力

谷歌提到Gemini for Home将"better at tuning out distracting chatter"（更好地过滤干扰性闲聊）。这是针对误唤醒的优化：当你和旁边的人聊天时，音箱不会误以为你在对它下指令。

这项改进的底层逻辑值得玩味。旧版Google Assistant的语音激活依赖关键词匹配，容易将相似发音误判为唤醒词。Gemini作为大语言模型，理论上具备更强的语义区分能力——能判断一段话是"对音箱说的"还是"背景噪音"。

清单二：谷歌没说的三件事

官方新闻稿的留白，往往比公开信息更有信息量：

① 全量替换时间表：没有

原文明确写道："Google has not yet provided a date for that wider rollout." Gemini for Home目前仍是早期体验计划，需要用户主动 opt in。这意味着大多数Google Home用户至今仍在用旧版Assistant，连续对话功能对他们而言仍是"未来时"。

谷歌的谨慎不难理解。将 household 设备的语音助手从规则引擎切换到大模型，涉及延迟、成本、隐私三重挑战。音箱的算力有限，Gemini的响应是否能做到"对话级"实时？每次查询都调用云端大模型，边际成本如何控制？这些都没有答案。