我下载过两个舌诊APP。
操作都差不多:拍一张舌头照片,等几秒,出来一份报告。"体质偏寒""脾胃虚弱""建议调理"。有的还配了食疗方案,红豆薏米水、姜茶之类。

打开网易新闻 查看精彩图片

第一次看完觉得有点意思。用了几次之后,我开始怀疑。

宣传98%,实际呢

舌诊系统的官网写着准确率98%。另一份临床研究,11000次样本,准确率87.3%。

差了十个百分点。

原因不难理解。实验室里的测试环境是标准光源、固定角度、专业拍摄。你在家里用手机拍,可能开着台灯,可能背对窗户,可能刚喝完一杯深色饮料。这些变量都会影响图像质量,进而影响判断结果。

安徽中医药大学附属医院做过对照研究,AI辅助舌诊确实能提升诊断效率。但他们反复强调一个词:辅助。

AI给参考,医生做决定。这两件事不是一个级别。

它在看什么

说白了就是深度学习。喂进去几万张带标签的舌头图片,模型学会识别颜色、纹理和某些特征跟疾病之间的统计关联。

新照片进来,它去翻训练数据里最像的那几张,输出一个概率最高的结论。

这个逻辑在理想条件下跑得不错。问题是现实不理想。

手机拍照的光照太不可控了。同一个舌头,白天客厅拍的和晚上卧室拍的,RGB值差一大截。算法对光照敏感度很高,这点误差传导到诊断结果上,可能直接改变结论。

数据集也有局限。如果训练样本主要来自某个地区、某个年龄段、某类饮食习惯的人群,换一群人用,准确率就会掉。目前公开的数据集规模都不大,覆盖面有限。

更关键的一点:舌象只是中医四诊里的"望"。闻(听声音)、问(症状)、切(脉象),这三个维度APP完全拿不到。光凭一张图做诊断,信息量本身就不够。

我试出来的问题

我用同一张舌头照片,在同一天上午,分别上传给三个不同APP。

结果出来了:一个说"湿热体质",一个说"脾虚夹湿",一个说"大致正常,注意保暖"。

打开网易新闻 查看精彩图片

同一张图,三种说法。

当然,医生之间也会有分歧。但医生的分歧建立在望闻问切综合判断的基础上,APP的分歧建立在单张图片的不同算法权重上。前者有临床经验兜底,后者只有统计学概率。

还有一个事让我不太舒服。注册这类APP的时候,基本都要授权相机权限,有些还要填年龄、性别、体重甚至月经周期。这些健康数据存在哪、会不会被拿去做别的用途,用户协议写得模模糊糊。

我没法确认它们有没有违规,但我确定自己不知道答案。

我的看法

AI面诊不是骗局。它在特定场景下确实有用——比如作为初步筛查工具,或者帮助没条件及时就医的人做个参考。

但它离"看病"这件事的距离,比宣传的要远得多。

我奶奶有次胃不舒服,让我帮她在手机上看一下。我拍了她的舌苔传上去,APP说"脾胃虚寒,建议温补"。后来去医院做了个胃镜,慢性浅表性胃炎伴幽门螺杆菌感染。医生开的方案跟APP的建议完全不一样。

这不是说APP完全不准。是说它能看到的东西太少,漏掉的东西太多。

拿来当个参考可以。拿来当决策依据,风险自负。

你敢把健康交给AI吗?欢迎在评论区聊聊

#AI面诊#科技养生#医疗AI#健康焦虑#数据准确性