昨天,GPT-4一本正经地告诉我"Amritavati"是一种真实存在的药物。语气笃定,细节丰富,完全错误。
对普通聊天机器人来说,这可能是段子的素材。但对健康平台而言,这是红线。这也解释了为什么给印度做健康AI,绝不能是翻译活儿那么简单。
我们正在做GoDavaii的第27天。核心功能是AI验证的Desi Ilaaj——把家庭偏方带进AI时代,且经过安全交叉验证。这意味着必须直面前沿模型的硬边界。
语言壁垒:不止于翻译
印度22种以上的官方语言,不是换个UI语言包就能解决的。健康概念怎么表达、症状怎么描述、偏方怎么理解,全是深层问题。
一个用户用泰米尔语输入"tabiyat theek nahi"——口语化的"不舒服"——AI得读出背后的症状,同时不丢失语境。我们的AI健康对话功能就在处理这种细微差别。
真正的难点是文化知识层。Desi Ilaaj没有统一文档。当面对地区性的传统查询时,一个在英文互联网数据上训练的大模型,会用听起来像那么回事的虚构内容填补空白。"Amritavati"就是这么来的——一次自信的幻觉。
我们的解法:专用知识图谱,加上超越通用大模型推理的验证层。
交叉验证:西医碰阿育吠陀
GoDavaii的核心护城河,是交叉验证西医和阿育吠陀疗法——不光在各自体系内验证,还要让两者互相对照。一个传统疗法里的常见退烧方,可能和另一个体系开的处方药产生相互作用。没有全球竞争者能在本地语言里大规模做这件事。
这是架构层面的问题。我们用微调模型(Gemini 2.5 Flash负责摘要和语言任务),加上由医疗专业人士和阿育吠陀专家搭建的自定义知识图谱。用户询问Desi Ilaaj时,我们先查验证过的数据库。只有在这之后才查询通用模型,且设有严格护栏来标记幻觉或低置信度输出。"Amritavati"就是这么被拦下来的。
安全优先的构建逻辑
我们在Startup Flight Vietnam入围全球14强,获得了曝光,但核心反馈始终绕回印度特有的问题集。正在上网的人群不会把英语当第一语言。他们的健康问题与饮食、环境、传统习俗、语言深度绑定。这不只是可及性——是安全。错误健康信息出现在被信任的AI界面里,是危险的。
GoDavaii是给家庭的问题生成器。下次看医生前的额外检查。帮医生提出更精准问题的方式。捕捉繁忙门诊可能遗漏的东西——尤其是现代医学与传统疗法的相互作用。
你觉得一个只懂英语的AI,在印度最搞不定哪种健康咨询?
热门跟贴