个人信息保护行动派
互联网时代,一次扫码,一次刷脸,一次弹窗的“同意”,指尖轻点间,你的隐私可能正在“裸奔”。南都大数据研究院“个人信息保护行动派”栏目,紧盯你我身边的隐私泄露“痛点”,拆解隐蔽的侵权“套路”,为个人信息安全筑起一道防火墙。我们一起,为权益发声。
南都此前发现,多款主流AI助手在涉及生物识别信息的用户图片、语音处理规则告知方面存在缺失,单独同意更为空白。(点击查看《AI看手相或泄露隐私,大模型敏感信息单独授权为何做不到》)。
图片、语音等用户输入内容是大模型训练的数据来源之一。《生成式人工智能服务管理暂行办法》规定训练涉及个人信息“应当取得个人同意”,近日发布的《人工智能应用伦理安全指引1.0》则建议收集用户数据训练模型应显著告知关闭方式。但南都研究员从用户角度体验发现,多数主流AI助手App默认将用户输入信息用于模型训练优化,部分更没有关闭选项,还有App声称有权商业化利用去标识化数据。
用户输入默认用于训练模型 有App无关闭选项
生成式AI的快速迭代需要海量数据“喂养”,用户输入内容正是优化训练阶段的数据来源之一。《生成式人工智能服务管理暂行办法》强调,训练涉及个人信息“应当取得个人同意”。
但从体验情况看,大部分AI助手App如Kimi、千问等,默认以经过加密、去标识化且无法重新识别特定个人等为前提,把用户输入内容等数据用于模型训练、服务优化。
如果用户不同意将自身输入内容用于模型训练优化,能否便捷地关闭或拒绝?豆包、DeepSeek虽然同样默认用户数据的此类用途,但提供了较为便捷的关闭方式。
豆包用户可在“设置-隐私与权限”中关闭“帮助模型改进效果”,还在其《帮助模型改进效果FAQ》中说明对用户输入内容数据所采取的隐私保护措施,明确数据只会与随机ID关联,不会关联到个人身份,且未经用户同意不会用于其他目的,也不会向第三方提供。DeepSeek则在“设置-数据管理”中提供“数据用于优化体验”开关,并专门发布《模型原理与训练方法说明》,承诺不会将数据用于用户画像或个性化推荐。
值得一提的是,元宝App的体验优化计划默认关闭,仅当用户主动开启时,输入数据才会被用于模型优化。同时,元宝隐私政策提到,用户调整或撤回前述授权不影响产品使用。
然而,文心和Kimi并未提供任何关闭或退出选项。文心的个人信息保护规则甚至表示,去标识化处理后的信息已无法识别主体,“在此情况下我们有权使用已经去标识化的信息”“有权对参与体验人员数据库进行分析并予以商业化的利用”。千问等虽允许用户拒绝,却需用户主动联系服务提供者操作。
“记忆”风险不容忽视 产品设计与隐私保护仍需平衡
研究表明,大模型在训练过程中容易形成对敏感数据的“非预期记忆”,也就是说,即使企业主观上不想留存用户信息,AI大模型在服务过程中也会不自觉地“记住”相关数据,并在特定输入诱导下泄露训练数据中的个人信息、敏感数据。例如,2024年,研究人员通过特定查询从ChatGPT中成功提取出数百条包含姓名、电话与邮箱的真实训练数据。南都记者也曾体验多款大模型发现:部分主流大模型可被多轮渐进式对话诱导,输出还原用户真实身份。
在全国网络安全标准化技术委员会2026年第一次标准周“个人信息保护标准解读与实践交流会”上,浙江大学网络空间安全学院副院长秦湛指出,人工智能大模型基于数千亿参数的超大规模神经网络架构,在训练和交互过程中,会隐性记忆、残留存储用户数据。因此,让大模型真正“忘掉”数据,成为保障用户个人信息删除权的关键路径。
中国法学会法治研究所研究员刘金瑞曾撰文提出,很多大模型默认将用户输入的提示作为训练数据、只为用户提供退出机制的做法,正当性值得质疑,至少在用户输入构成个人信息的时候,应当原则上征得个人同意或者具有其他合法依据。
根据《人工智能应用伦理安全指引1.0》及国标《生成式人工智能服务安全基本要求》等文件,服务提供者应为用户提供便捷关闭输入信息用于训练的选项,关闭路径从主界面起不宜超过4次点击,并需显著告知收集状态与关闭方式。但从体验情况看,部分产品离这一要求仍有明显距离。如何在产品迭代与个人信息保护之间找到平衡,让用户输入不再“裸奔”,是每一家AI服务提供者必须回答的合规命题。
出品:南都大数据研究院
采写:南都研究员 唐静怡
设计:何欣 欧阳静
*体验时间为2026年5月底,手机为ios系统,样本均已升至最新版本
热门跟贴