打开网易新闻 查看精彩图片

AI产品评估这事,有点像餐厅评分——分数高的未必好吃,分数低的反而可能藏着惊喜。HackerNoon最近给一批参赛项目打了「实用性证明分」(Proof of Usefulness Score),Emisary拿了32分,Scribe 39分,Functionland Fula直接飙到98分。跨度这么大,评委到底在看什么?

Emisary做的是AI反馈日记。不是那种让你写小作文的日记,而是把你和AI的聊天记录自动整理成可操作的改进建议。32分这个成绩,在满分100的体系里算下游,但HackerNoon还是把它放进了获奖名单。按官方说法,这个分数反映的是「当前实用价值」,不是未来潜力——换句话说,评委在押注「现在能用」而不是「以后可能行」。

打开网易新闻 查看精彩图片

对比来看,Functionland Fula的98分来自去中心化存储,解决的是网盘倒闭、数据丢失的痛点。Scribe的39分则是把群聊链接汇总成摘要,省得你爬楼翻记录。三个项目分数差三倍,但共同点是都切中了具体场景:写日记太累、群聊太碎、网盘太虚。

HackerNoon的编辑在评语里留了一句:「我们不是在找最聪明的AI,是在找最省心的工具。」这场从1月持续到6月的黑客马拉松,奖金池超过15万美元,赞助商包括BrightData和Neo4j。Emisary能分一杯羹,大概是因为评委相信——让人愿意每天打开的AI,比让人惊叹的AI更难做。