品玩2月10日讯,GitHub开发者sseanliu近日开源VisionClaw项目,为Meta Ray-Ban智能眼镜提供实时AI助手能力。该方案结合Gemini Live API与可选的OpenClaw本地网关,支持用户通过语音指令实现视觉识别、消息发送、购物清单管理及附近地点搜索等功能。
系统通过眼镜摄像头以约1fps频率传输JPEG图像至Gemini,并建立双向实时音频通道。iPhone亦可作为测试设备模拟完整流程。项目架构清晰,包含音频管理、视频采集、工具调用路由等模块,要求iOS 17及以上系统及Xcode 15.0+开发环境。
VisionClaw已在GitHub获得超590星标,代码遵循开源许可协议,为智能穿戴设备的AI集成提供了可复用的技术范式。
打开网易新闻 查看精彩图片
热门跟贴