对话Chance AI创始人：看见世界的另一条路，走出“大模型同质化”的围墙|chance|小红书|扎哈·哈迪德|曾熙|知名企业|视觉|达芬奇

在当下规模空前的AI竞争里，“大模型”成了所有公司的默认答案。大家都在升级算力、打榜、抢占各种入口。然而就在行业叙事越来越收敛时，一家几乎把所有主流做法都否定掉的创业公司出现了——Chance AI。创始人曾熙把输入框从首页删掉，做了个不需要你发问的AI App，只用抬手一拍，就能帮你以文字解读任何看到的东西，这更符合直觉。

现场，曾熙用拍了一对球鞋Air Jordan 1的图片，Chance AI告诉我们它值30万美金，为什么？这是在乔丹当年总决赛穿的那一对；它还能帮女生看穿搭。出门前自拍一张，App能告诉她，这个搭配如果换一个颜色的围巾, 或者再加一个什么颜色的包搭配度更高。

很快，在被北美大学生圈粉后，团队又奔着年轻一代的呼声，开发了点评OOTD（每日穿搭）、看手相、看肤质、毒舌点评等一系列功能。
光解读不算完，用户还可以一键分享到Chance AI自带的社区，“所见”成了用户自己的谈资，一群18-25岁的年轻人也由此聚到了一起。

CTO吴晓凡向华尔街见闻透露，Chance AI已经在全球吸引了25万左右的用户。
由此，一个Google Lens+小红书、Instagram的形态渐渐成型，Chance AI也初步集齐了爆款要素。而且年轻人用得越多，就越是能捕捉到他们真实的需求，曾熙说，“我们二十多万用户，每个北美女生平均每天会拍2.8次穿搭，这个数据量是多么恐怖”。
手握大厂和电商们梦寐以求的富矿，但曾熙和团队却没急于变现，也不打算盲目追眼下大火的AI硬件之风，甚至暂时不敢搞更大规模的宣传，怕基建一时撑不起“泼天的富贵”。
他们打算继续打磨自家的视觉Agent，把这个“视觉大脑”开发得更强大，继而积累更丰富的数据，形成视觉社区，加速起“滚雪球”。
在AI产品逐渐同质化的当下，曾熙成了逃离主流叙事的少数派，却挖到了人类直觉的共识：如果人类有70%的大脑带宽用于处理视觉，那AI的未来入口就不应该继续被一个输入框垄断。
Chance AI的选择或许激进，但在一个日益内卷的赛道里，反而因为稀缺显得更值得观察。

把交互拉回视觉本能

当行业已经习惯用“人提问，AI回答”的方式来定义产品边界时，Chance AI创始曾熙向华尔街见闻提出一个问题：“为什么眼睛不长在屁股上？”
因为在人类的进化逻辑里，视觉才是第一性原理，而语言只是更晚出现的编码系统。
曾熙提到，从进化角度来看，人类大脑中约有 70% 的信息处理与视觉相关——在语言出现之前，人类已经依靠视觉来识别环境、判断危险与机会。
过去十年，所有主流交互方式都被输入框标准化了。用户必须提前知道问题是什么，必须把需求翻译成语言，再把语言交给一个模型。
对大多数人来说，这种方式并不自然。人在街上看到奇特的建筑、看到陌生的艺术、看到一个模糊的符号，第一反应是“被吸引”，而问题则是在注意力之后产生的。
曾熙就说：“提示词是为懒惰的AI准备的。”
他的意思并不是攻击prompt生态，而是认为，大部分时候prompt是人在帮模型工作，是在补齐模型缺失的推理链条。如果AI真够聪明，它不应该依赖人教它“怎么问”，它应该能够通过视觉线索主动理解用户的关注点。
曾熙向华尔街见闻讲了一个故事。他说自己是艺术爱好者，两年前曾经自己为办展而做了一个AI扫描讲解的小程序。然而撤展后，曾熙发现居然还有1500多人在用那个小程序，调研后他发现，用户这些用户已经形成肌肉记忆，用它来扫描各种花草、电影、服饰，继续跟AI聊。
事实上，曾熙身上就有很重的设计师责任感，“我们的使命就是消除科技和人之间的隔阂。AI 在很多人眼里可能有点‘高冷’，但我的目标是让它变得更自然、更贴近人类的本能需求——用视觉去理解和探索世界。”
基于这个判断直接决定了产品形态。Chance AI从第一天起就把输入框从核心界面移除。
“看”成为默认动作，“问”变成可选动作。用户不需要组织语言，不需要提前构造问题，也不需要费力去寻找“AI最喜欢的提问方式”。在行业几乎所有人都在加强语言交互时，这个决定显得非常逆势。
但也正因如此，它避开了大多数模型挤在一起的赛道。输入框代表的是目的性，而视觉代表的是本能；输入框强调解决问题，而视觉强调触发好奇。Chance AI的交互方式与其说像工具，不如说更像一种认知肌肉的训练。
然而，先行者也承担着风险。眼下行业已经在语言交互上建立了完整的用户路径，从搜索到电商再到助手模式，用户也被训练得越来越依赖“提问题”。
视觉能否真正成为新的入口并没有确定答案，硬件形态也没有成熟。但在一个高度统一的赛道上，Chance AI至少试图让问题重新变得开放，而不是跟着所有人一起继续把交互压成一个框。

从识别到意义推理

Chance AI真正的非共识之处，并不在于它使用了摄像头，而在于它把“解释意义”当成了AI的核心能力。
曾熙说，他创办 Chance AI 的灵感要追溯到小时候对《蒙娜丽莎》的一次观摩。“当我站在尺幅比想象中小很多的她面前，满怀期待却完全看不懂其中的意义，‘不就是这么小一张画，有什么了不起的’，匆匆看了一眼就走了”。
“人类是视觉动物，也是故事动物，我们天生会被眼前的景象吸引，但真正触动我们的是其背后的故事”。后来，当曾熙有机会深入了解了达芬奇和这幅画背后的故事，终明白它为何被称为人类文明的瑰宝。
曾熙说，Chance AI 的使命是用科技帮助人们发现这些隐藏的故事，消除人与世界之间的隔阂。至于 “Chance” 这个名字，它并不仅代表“机会”，更代表“偶然性”（contingency）。
在他看来，生物进化的过程依赖于偶然性，而人类知识与创意的诞生，也常常来源于这些偶然的碰撞。Chance AI 希望通过连接视觉与故事，加速这些知识的交汇，让每一次视觉体验都更加深刻而有意义。
回溯来看，过去一年整个行业在多模态方向大幅前进，主流模型对图像的识别、标注、描述都变得越来越准确。然而在曾熙看来，所有这些能力几乎都有一个共同的上限：它们能说清“这是什么”，但很难进一步解释“它为什么重要”。
人类对世界的理解从来不是停留在事实层面。无论是电影解说、球赛评论、旅行导览还是艺术讲解，人之所以需要这些角色，是因为它们帮助我们把事实转化为意义，把信息解压成故事，把看到的东西与更大的文化体系建立联系。在这个意义上，视觉就是一种推理方式。
Chance AI的产品在这里做了一个明显的选择。它并不满足于给出一个客观描述，而试图把一个物件的知识背景、文化语境、社会共识都调动起来。
曾熙向华尔街见闻举例：一个石头不再只是“混凝土上放着的巨石”，而是洛杉矶LACMA的LevitatedMass，是花了一千三百万美元运输的公共艺术，是关于美国城市阶层结构的隐喻。一栋楼不只是“未来主义摩天大楼”，而是扎哈·哈迪德的遗作之一，是紫荆花含苞待放的象征。
这种解释并并非模型自动生成的，而是一种主动的意义推理。它的前提是模型愿意介入、愿意解释、愿意冒一定的主观风险。这恰恰是主流模型最不愿意做的。
在业内人士看来，大厂模型的策略极其保守，更倾向于提供安全、标准化、无争议的信息；而解释本身意味着主观性，也意味着争议，这对于大型商业产品来说会放大风险。
这也是为什么“意义推理”一直是行业的灰色地带。大公司不做，并不代表它们不能做，而是做了反而可能带来成本。Chance AI的定位让它有能力承担这些“不确定的解释”，也让它在“视觉理解”这条路上走得比别人更远。
但这种模式的局限也显而易见。文化语境可能出现偏差，意义叙述可能变成一种新的“AI算命”。模型越往“解释”走，越需要在深度和准确性之间找到平衡。对大厂来说，这是不能冒的险，对Chance来说，这是必须承担的边界。
但正因为它站在巨头最不愿意涉足的区域，它反而拥有一个罕见的时间窗口。它试图回答的是“AI能否提升人的理解力”。它确实击中了一部分人真正的需求：在一个溢满信息的世界里，判断比答案更稀缺，理解比速度更重要。
Chance AI的问题在于，它的路线需要耐心，需要生态，需要硬件，需要文化习惯的迁移。它的优势在于，它比别人更早意识到，AI的下一次入口变化，可能发生在视觉。
在一个所有公司都押注语言模型的时代，这个判断显得孤独，但也因此值得被记录。