内罗毕的街头,一位焊工接过顾客递来的手机。屏幕上是一张Pinterest截图,一道铁艺大门。"这个多少钱?"顾客问。焊工眯眼看了几秒,心算一阵,随手在纸板上写了个数字。没有材料明细,没有分项价格。顾客点点头,转身去找看起来更"正规"的作坊。
这种场景每天在肯尼亚重复成千上万次。当地人称这些户外工匠为"jua kali"——斯瓦希里语的"烈日之下"。1500万非正式手艺人靠这门营生:焊铁门、打家具、做窗框、装橱柜。他们手艺过硬,却因为拿不出一份像样的现场报价单,眼睁睁看着订单流失。
一位开发者用谷歌最新开源模型Gemma 4做了件小事,试图改变这个局面。
这款名为Jua Kali Quote的工具逻辑极其简单。工匠用手机拍下顾客带来的任何参考图——手绘草图、Instagram截图、邻居家的成品门——Gemma 4 26B A4B(混合专家架构版本)分析图像内容,识别结构类型,估算尺寸规格,自动生成包含材料、用量、人工费用的完整报价单,货币单位为肯尼亚先令。
工匠可以点击任意项目手动调价。系统实时重算总价。一键分享至WhatsApp,顾客聊天窗口里立刻收到一份格式规范的PDF报价。整个流程控制在60秒内完成。所有记录本地存储,方便回头客询价或同类项目参考。
系统 upfront 显示置信度提示:"材料费±15%,人工费±20%"。哪些数字是估算,哪些相对精确,一目了然。
为什么选Gemma 4的MoE版本
开发者解释了三条技术选型理由。
第一,视觉理解不止于像素。模型不是简单识别"一个带竖线的矩形",而是推断出"这是约12英尺宽的门板设计",进而判断需要四个铰链而非两个。手绘草图和手机翻拍图都能处理。
第二,推理链能拆解复杂结构。面对多层货架或带装饰线条的橱柜,模型逐步分析组件关系,而非给出笼统总价。
第三,26B激活参数在本地可部署。肯尼亚的网络基础设施不稳定,MoE架构的稀疏激活特性让边缘运行成为可能。
技术栈相当朴素:Python+FastAPI后端,Gemma 4通过Google AI Studio API调用,前端纯HTML/CSS/JS移动优先适配,本地存储用localStorage。没有花哨的中台,没有复杂的用户系统。
覆盖六种工种
当前版本支持焊接、木工、泥瓦、管道、电气、油漆六类作业。开发者开源了完整代码,配置流程只有四步:建虚拟环境、装依赖、复制环境变量文件、填入API密钥。本地运行命令是一行uvicorn。
这个项目的特殊之处在于问题定义的精准。它没有试图做"非洲版SAP"或"工匠数字化平台"这种宏大叙事,而是锁定一个具体场景:街头交易中的信任建立。一份格式专业的报价单,在肯尼亚的语境里不只是效率工具,更是职业身份的视觉证明。
谷歌AI Studio提供免费API额度,意味着单个工匠的试用成本趋近于零。这是开源模型+云API组合在新兴市场落地的典型路径:技术门槛由开发者承担,终端用户只需一部能拍照的智能手机。
热门跟贴