打开网易新闻 查看精彩图片

AI产品评测圈最近出了个怪事。一个叫Emisary的团队,没搞大模型、没堆算力,就做了个"AI反馈日记"功能,在HackerNoon的实用性评分里拿了32分——刚好压线及格,却挤进了榜单。

这评分叫"Proof of Usefulness",满分100。同期参赛的Functionland Fula拿了98分,做的是去中心化存储;Scribe拿了39分,做的是群聊信息整理。Emisary的分数最低,但评委给的评语最长。

打开网易新闻 查看精彩图片

他们做了什么?简单说,就是把用户和AI的对话变成可操作的改进清单。不是那种"AI说错了"的笼统抱怨,而是自动拆解成"这里逻辑跳了""这个例子不贴切"的具体条目。团队创始人原话:「我们想让反馈像记账一样,越记越清楚自己到底在烦什么。」

这个思路有点反常识。现在大家都在卷模型能力,Emisary却盯着"用户骂完就忘"的痛点。32分里,技术分只占一小部分,大部分给了"用户真的回来填了第二篇日记"这个留存数据。

评委私下吐槽:这项目放在两年前就是个小工具,现在反而稀缺了。毕竟当所有人都在教AI怎么说话,没几个人关心用户说完之后怎么办。