在上周日的国际残疾人日之前,苹果公司发布了一部短片,展示了今年早些时候在iOS 17中首次亮相的个人语音辅助功能。个人语音允许用户创建自己语音的数字版本,用于通话、支持的应用程序和苹果自己的实时语音工具。

对于那些因帕金森病、多发性硬化症、肌萎缩侧索硬化症和声带麻痹等疾病而有可能永久失声的人来说,听起来不像自己可能是另一种形式的身份丧失。在你还能发声的时候,能够复制出自己的声音,可能有助于缓解你再也找不到自己的感觉,或者你爱的人再也听不出你的声音了。

所有iOS 17、iPadOS 17和macOS Sonoma用户都可以创建个人声音,以备将来需要——无论是临时使用还是长期使用。我发现这个过程(在我的iPhone 14 Pro上)非常简单,而且对我的声音非常满意。只要你升级到iOS 17、iPadOS 17或macOS Sonoma(在安装了苹果芯片的mac电脑上),你就可以在这里设置自己的个人声音。

在开始这个过程之前,确保你有大约30分钟的空闲时间。你将被要求记录150个句子,根据你说话的速度,这可能需要一些时间。你还应该找一个安静的地方,背景声音最小,感觉舒服。在身边放一杯水,确保你的手机至少有30%的电量也是值得的。

当你准备好了,进入个人语音菜单,打开设置,找到可访问性>个人语音(在语音)。选择“创建个人声音”,苹果会给你一个概要。点击继续,你会看到“找一个安静的地方”和“慢慢来”这样的指示。

重要的是,其中一个建议是“自然地说话”。苹果鼓励用户“以一致的音量大声朗读,就像在交谈一样。”点击此页面上的“继续”后,还有最后一步,在你开始阅读提示之前,你的手机会使用麦克风来分析背景噪音的水平。

记录过程的布局相当直观。点击底部红色的大记录按钮,读出页面中间的单词。在录制按钮下方,您可以选择“连续录制”或“每个短语停止”。

在后一种模式下,每次录制一个短语时,你都必须点击一个按钮,而Continuous则是一种更免手的体验,它依赖于手机来知道你什么时候结束了通话。对于那些有语言障碍或阅读缓慢的人来说,连续模式可能会让他们感到压力太大。虽然对我来说只发生过一次,但在我准备好之前,iPhone试图跳到下一个短语,这一事实足以让我觉得我需要迅速做出反应。

不过,在大多数情况下,系统都能准确地识别出我什么时候说完话,并提供了足够的暂停时间,让我可以在进入下一个句子之前点击重做按钮。这些提示主要包括历史和地理信息,偶尔会有表达性的感叹。有相当多样的短语选择,从简单的问题,如“你能问他们是否在用那把椅子吗?”到“马上回屋里去!”或者“哎哟!”那真的很热!”

我发现自己在读那些特别的句子时尽量夸张一些,因为我不想让自己的声音太过机械。但就在我这么做的时候,我意识到了这个过程中固有的问题。无论我的表演或表演有多好,录音中总会有技巧的成分。即使我尽我最大的努力假装有什么东西真的很热,伤害了我,这仍然不是一个真实的反应。我在叙述句子和和朋友聊天时的声音肯定是不同的。

这并不是对苹果或Personal Voice的批评,而只是一种观察,说明我的语言自我被复制的程度是有限的。当你完成所有150个句子时,苹果会解释说这个过程“可能需要一夜之间完成”。它建议你充电并锁定你的iPhone,你的个人声音“只会在iPhone充电并锁定时生成”,当它准备好使用时,你会收到提醒。值得注意的是,在这段时间里,苹果正在完全在设备上训练神经网络,以生成文本到语音的模型,而不是在云端。

在我的测试中,在我放下iPhone 20分钟后,只取得了4%的进展。20多分钟后,“个人声音”只完成了6%。所以这绝对是你需要分配几个小时的事情,如果不是一整个晚上的话。如果你还没有准备好长时间放弃你的设备,你仍然可以使用你的手机-只是要知道它会延迟这个过程。

当你的“个人语音”准备好了,你会收到一个通知,然后你就可以去设置中尝试了。在你开始创建过程的同一页面上,你会看到跨设备共享语音的选项,以及允许应用程序请求使用它的选项。前者会在iCloud中存储你的语音副本,以便在你的其他设备上使用。在传输过程中,你的数据将被端到端加密,你录制的录音只会存储在你用来创建它的手机上,但你可以导出你的片段,以防你想在其他地方保存一份副本。

您可以命名您的个人声音,并创建另一个,如果你喜欢(你可以产生最多三个)。要收听您创建的声音,请回到可访问性设置的“语音”部分,然后选择“实时语音”。打开它,在声音下选择你的新创作,然后三次点击你的电源按钮。在方框中输入一些内容,然后点击发送。你可以决定你是否喜欢你所听到的,以及你是否需要发出一种新的个人声音。

一开始,当我试着问“今天天气怎么样?”但几天后,我开始输入“特伦斯是个怪物”这样的短语,感觉确实更像我了。仍然像机器人一样,但感觉声音里有足够多的切琳,我的经理会知道这是我在骂他。

今年人们对深度造假和人工智能生成内容的担忧达到了历史最高水平,也许在计算机生成的声音中加入一点技巧并不是一件坏事。我当然不希望有人拿着我的手机,录下我在数字世界里说的那些我在现实生活中永远不会说的话。找到一种方法,让人们有一种自我意识,提高可访问性,同时克服目前围绕身份和技术存在的所有限制和警告,这是一种微妙的平衡,我很高兴看到苹果至少尝试了Personal Voice。