几周前,Reddit的r/DHExchange板块出现了一则帖子,标题写着:"我囤积了一个大型数据库,内容绝对出乎你意料……15万张粪便照片。"发帖人Ill_Car_7351正在兜售的,是一款AI粪便分析应用积累的用户数据。

这款名为PoopCheck的应用由Soft All Things公司开发,宣称利用AI分析用户拍摄的粪便照片,依据"布里斯托粪便分类法"给出每日肠道健康评分。该分类法将粪便分为七种类型,从"坚果状硬块"到"完全水样"不等。应用还设有"社区"功能,用户可选择分享照片并获得积分,截至发稿时"共享粪便"数量已达151,317条。

打开网易新闻 查看精彩图片

发帖人声称拥有来自约2.5万名用户的15万张标注图像,强调这些数据"极其稀有",适用于机器学习训练、癌症研究等场景。他在帖文中写道:"感觉自己坐在一堆闪亮的硬币上,却找不到买家。"

帖子下方的评论大多表达震惊:"当我5岁时老师教我认字,现在我后悔那件事发生了。""这他妈是什么。""怎么删掉别人的帖子。"

记者以买家身份联系发帖人后,对方开始推销这份数据库,由此揭开了健康类应用用户数据地下交易的冰山一角。尽管PoopCheck声称照片不会自动进入社区,需要用户主动选择分享,但应用对于上传数据的处理说明存在矛盾之处——用户在不知情的情况下,其高度敏感的生物特征数据可能已被纳入可交易资产。

这起事件暴露出AI健康应用领域的核心隐患:当用户为获取便利而上传最私密的身体数据时,平台对数据的实际控制边界究竟在哪里?那些标注着"寄生虫""结肠癌猜测"的社区讨论,与黑市上明码标价的医学训练数据集之间,只隔着一个数据库导出按钮。