打开网易新闻 查看精彩图片

30亿美元估值的Perplexity是一级市场里估值最高的AI应用公司之一,简单点来说,是换个典型“套壳”产品——没有底层的大模型能力,只做根植于模型之上的产品。

AI搜索是过去一年为数不多被验证的原生AI产品,外部得到的数据是,Perplexity目前2000万月活跃用户,预计年内达到1亿MAU与1亿美元ARR。

与Perplexity类似,liner, phind, globe, 秘塔搜索,360 AI搜索等,都是这一代AI搜索的典型,另一方面,包括小红书等内容平台也都在这个方向上做探索,相比于给用户一堆链接与答非所问的同质化信息,直接给出答案似乎是更好的选择。

AI搜索核心是RAG,即“检索增强生成”,大概分三个步骤:

  1. 根据用户搜索内容调用各大搜索引擎 API,获取结果
  2. 设置提示词,把检索结果作为挂载上下文;
  3. 整合答案,标注引用来源,给出用户结果。

如果你足够关注这轮GenAI,对于这家公司在媒体上更多看到的是褒扬,但追溯其商业逻辑本质,你可以发现它是个名副其实的“AI大盗”,以下部分观点来源于《The Verge》。

有关答案引擎?The Verge认为公司正通过“不道德”的手段试图在信息搜索领域取得突破,创建一个与谷歌搜索竞争的“答案引擎”。

Perplexity的商业模式弊端:作为信息的“中间商”,Perplexity利用了高质量信息源,直接提供直接答案而非链接,从而截取原本属于信息源的广告收入——这对原本可以通过展示广告获取收入的信息源影响很大。

侵犯版权问题:Perplexity通过绕过付费墙,使用Forbes等媒体的调查报道内容,却很少引用原始来源,甚至使用原图,这构成版权侵犯。

忽视robots.txt:Perplexity无视网站设置的爬虫协议,继续抓取内容,要知道有些站点设置此内容就是为了不被搜索引擎收录,比如淘宝早期就不允许百度抓取其商品内容。

信息准确性问题:Perplexity开始展示AI生成的结果和错误信息,与其宣称的“事实性和准确性”相违背,事实上这个问题无解,因为无论什么搜索都不太给出100%完全准确的信息,作为信息中间商,自然也面临这个问题,但他们商业包装会让用户认为信息足够权威准确。

CEO过往的争议行为:Aravind Srinivas曾通过伪装成学术研究者的方式,利用X的API获取数据,涉嫌欺骗,此外,尽管公司声称正在与出版商开发收入共享计划,但实际并未采取有效措施。
如果说Perplexity是优势在于让“搜索引擎”更加好用,节省了用户时间,那么弊端也很明显:在某种程度破坏了互联网信任的基础,截取信息的同时给中小网站的收入带来打击,而在GenAI突飞猛进的今天,用户或投资者似乎还未关注到这个问题。