打开网易新闻 查看精彩图片

在当下规模空前的AI竞争里,“大模型”成了所有公司的默认答案。大家都在升级算力、打榜、抢占各种入口。然而就在行业叙事越来越收敛时,一家几乎把所有主流做法都否定掉的创业公司出现了——Chance AI。创始人曾熙把输入框从首页删掉,做了个不需要你发问的AI App,只用抬手一拍,就能帮你以文字解读任何看到的东西,这更符合直觉。

现场,曾熙用拍了一对球鞋Air Jordan 1的图片,Chance AI告诉我们它值30万美金,为什么?这是在乔丹当年总决赛穿的那一对;它还能帮女生看穿搭。出门前自拍一张,App能告诉她,这个搭配如果换一个颜色的围巾, 或者再加一个什么颜色的包搭配度更高。

很快,在被北美大学生圈粉后,团队又奔着年轻一代的呼声,开发了点评OOTD(每日穿搭)、看手相、看肤质、毒舌点评等一系列功能。
光解读不算完,用户还可以一键分享到Chance AI自带的社区,“所见”成了用户自己的谈资,一群18-25岁的年轻人也由此聚到了一起。

CTO吴晓凡向华尔街见闻透露,Chance AI已经在全球吸引了25万左右的用户。
由此,一个Google Lens+小红书、Instagram的形态渐渐成型,Chance AI也初步集齐了爆款要素。而且年轻人用得越多,就越是能捕捉到他们真实的需求,曾熙说,“我们二十多万用户,每个北美女生平均每天会拍2.8次穿搭,这个数据量是多么恐怖”。
手握大厂和电商们梦寐以求的富矿,但曾熙和团队却没急于变现,也不打算盲目追眼下大火的AI硬件之风,甚至暂时不敢搞更大规模的宣传,怕基建一时撑不起“泼天的富贵”。
他们打算继续打磨自家的视觉Agent,把这个“视觉大脑”开发得更强大,继而积累更丰富的数据,形成视觉社区,加速起“滚雪球”。
在AI产品逐渐同质化的当下,曾熙成了逃离主流叙事的少数派,却挖到了人类直觉的共识:如果人类有70%的大脑带宽用于处理视觉,那AI的未来入口就不应该继续被一个输入框垄断。
Chance AI的选择或许激进,但在一个日益内卷的赛道里,反而因为稀缺显得更值得观察。

把交互拉回视觉本能

当行业已经习惯用“人提问,AI回答”的方式来定义产品边界时,Chance AI创始曾熙向华尔街见闻提出一个问题:“为什么眼睛不长在屁股上?”
因为在人类的进化逻辑里,视觉才是第一性原理,而语言只是更晚出现的编码系统。
曾熙提到,从进化角度来看,人类大脑中约有 70% 的信息处理与视觉相关——在语言出现之前,人类已经依靠视觉来识别环境、判断危险与机会。
过去十年,所有主流交互方式都被输入框标准化了。用户必须提前知道问题是什么,必须把需求翻译成语言,再把语言交给一个模型。
对大多数人来说,这种方式并不自然。人在街上看到奇特的建筑、看到陌生的艺术、看到一个模糊的符号,第一反应是“被吸引”,而问题则是在注意力之后产生的。
曾熙就说:“提示词是为懒惰的AI准备的。”
他的意思并不是攻击prompt生态,而是认为,大部分时候prompt是人在帮模型工作,是在补齐模型缺失的推理链条。如果AI真够聪明,它不应该依赖人教它“怎么问”,它应该能够通过视觉线索主动理解用户的关注点。
曾熙向华尔街见闻讲了一个故事。他说自己是艺术爱好者,两年前曾经自己为办展而做了一个AI扫描讲解的小程序。然而撤展后,曾熙发现居然还有1500多人在用那个小程序,调研后他发现,用户这些用户已经形成肌肉记忆,用它来扫描各种花草、电影、服饰,继续跟AI聊。
事实上,曾熙身上就有很重的设计师责任感,“我们的使命就是消除科技和人之间的隔阂。AI 在很多人眼里可能有点‘高冷’,但我的目标是让它变得更自然、更贴近人类的本能需求——用视觉去理解和探索世界。”
基于这个判断直接决定了产品形态。Chance AI从第一天起就把输入框从核心界面移除。
“看”成为默认动作,“问”变成可选动作。用户不需要组织语言,不需要提前构造问题,也不需要费力去寻找“AI最喜欢的提问方式”。在行业几乎所有人都在加强语言交互时,这个决定显得非常逆势。
但也正因如此,它避开了大多数模型挤在一起的赛道。输入框代表的是目的性,而视觉代表的是本能;输入框强调解决问题,而视觉强调触发好奇。Chance AI的交互方式与其说像工具,不如说更像一种认知肌肉的训练。
然而,先行者也承担着风险。眼下行业已经在语言交互上建立了完整的用户路径,从搜索到电商再到助手模式,用户也被训练得越来越依赖“提问题”。
视觉能否真正成为新的入口并没有确定答案,硬件形态也没有成熟。但在一个高度统一的赛道上,Chance AI至少试图让问题重新变得开放,而不是跟着所有人一起继续把交互压成一个框。

从识别到意义推理

Chance AI真正的非共识之处,并不在于它使用了摄像头,而在于它把“解释意义”当成了AI的核心能力。
曾熙说,他创办 Chance AI 的灵感要追溯到小时候对《蒙娜丽莎》的一次观摩。“当我站在尺幅比想象中小很多的她面前,满怀期待却完全看不懂其中的意义,‘不就是这么小一张画,有什么了不起的’,匆匆看了一眼就走了”。
“人类是视觉动物,也是故事动物,我们天生会被眼前的景象吸引,但真正触动我们的是其背后的故事”。后来,当曾熙有机会深入了解了达芬奇和这幅画背后的故事,终明白它为何被称为人类文明的瑰宝。
曾熙说,Chance AI 的使命是用科技帮助人们发现这些隐藏的故事,消除人与世界之间的隔阂。至于 “Chance” 这个名字,它并不仅代表“机会”,更代表“偶然性”(contingency)。
在他看来,生物进化的过程依赖于偶然性,而人类知识与创意的诞生,也常常来源于这些偶然的碰撞。Chance AI 希望通过连接视觉与故事,加速这些知识的交汇,让每一次视觉体验都更加深刻而有意义。
回溯来看,过去一年整个行业在多模态方向大幅前进,主流模型对图像的识别、标注、描述都变得越来越准确。然而在曾熙看来,所有这些能力几乎都有一个共同的上限:它们能说清“这是什么”,但很难进一步解释“它为什么重要”。
人类对世界的理解从来不是停留在事实层面。无论是电影解说、球赛评论、旅行导览还是艺术讲解,人之所以需要这些角色,是因为它们帮助我们把事实转化为意义,把信息解压成故事,把看到的东西与更大的文化体系建立联系。在这个意义上,视觉就是一种推理方式。
Chance AI的产品在这里做了一个明显的选择。它并不满足于给出一个客观描述,而试图把一个物件的知识背景、文化语境、社会共识都调动起来。
曾熙向华尔街见闻举例:一个石头不再只是“混凝土上放着的巨石”,而是洛杉矶LACMA的LevitatedMass,是花了一千三百万美元运输的公共艺术,是关于美国城市阶层结构的隐喻。一栋楼不只是“未来主义摩天大楼”,而是扎哈·哈迪德的遗作之一,是紫荆花含苞待放的象征。
这种解释并并非模型自动生成的,而是一种主动的意义推理。它的前提是模型愿意介入、愿意解释、愿意冒一定的主观风险。这恰恰是主流模型最不愿意做的。
在业内人士看来,大厂模型的策略极其保守,更倾向于提供安全、标准化、无争议的信息;而解释本身意味着主观性,也意味着争议,这对于大型商业产品来说会放大风险。
这也是为什么“意义推理”一直是行业的灰色地带。大公司不做,并不代表它们不能做,而是做了反而可能带来成本。Chance AI的定位让它有能力承担这些“不确定的解释”,也让它在“视觉理解”这条路上走得比别人更远。
但这种模式的局限也显而易见。文化语境可能出现偏差,意义叙述可能变成一种新的“AI算命”。模型越往“解释”走,越需要在深度和准确性之间找到平衡。对大厂来说,这是不能冒的险,对Chance来说,这是必须承担的边界。
但正因为它站在巨头最不愿意涉足的区域,它反而拥有一个罕见的时间窗口。它试图回答的是“AI能否提升人的理解力”。它确实击中了一部分人真正的需求:在一个溢满信息的世界里,判断比答案更稀缺,理解比速度更重要。
Chance AI的问题在于,它的路线需要耐心,需要生态,需要硬件,需要文化习惯的迁移。它的优势在于,它比别人更早意识到,AI的下一次入口变化,可能发生在视觉。
在一个所有公司都押注语言模型的时代,这个判断显得孤独,但也因此值得被记录。