AI搜索大盗贼：Perplexity

一言楠尽

2024-07-09 13:02 ·北京

30亿美元估值的Perplexity是一级市场里估值最高的AI应用公司之一，简单点来说，是换个典型“套壳”产品——没有底层的大模型能力，只做根植于模型之上的产品。

AI搜索是过去一年为数不多被验证的原生AI产品，外部得到的数据是，Perplexity目前2000万月活跃用户，预计年内达到1亿MAU与1亿美元ARR。

与Perplexity类似，liner, phind, globe, 秘塔搜索，360 AI搜索等，都是这一代AI搜索的典型，另一方面，包括小红书等内容平台也都在这个方向上做探索，相比于给用户一堆链接与答非所问的同质化信息，直接给出答案似乎是更好的选择。

AI搜索核心是RAG，即“检索增强生成”，大概分三个步骤：

根据用户搜索内容调用各大搜索引擎 API，获取结果
设置提示词，把检索结果作为挂载上下文；
整合答案，标注引用来源，给出用户结果。

如果你足够关注这轮GenAI，对于这家公司在媒体上更多看到的是褒扬，但追溯其商业逻辑本质，你可以发现它是个名副其实的“AI大盗”，以下部分观点来源于《The Verge》。

有关答案引擎？The Verge认为公司正通过“不道德”的手段试图在信息搜索领域取得突破，创建一个与谷歌搜索竞争的“答案引擎”。

Perplexity的商业模式弊端：作为信息的“中间商”，Perplexity利用了高质量信息源，直接提供直接答案而非链接，从而截取原本属于信息源的广告收入——这对原本可以通过展示广告获取收入的信息源影响很大。

侵犯版权问题：Perplexity通过绕过付费墙，使用Forbes等媒体的调查报道内容，却很少引用原始来源，甚至使用原图，这构成版权侵犯。

忽视robots.txt：Perplexity无视网站设置的爬虫协议，继续抓取内容，要知道有些站点设置此内容就是为了不被搜索引擎收录，比如淘宝早期就不允许百度抓取其商品内容。

信息准确性问题：Perplexity开始展示AI生成的结果和错误信息，与其宣称的“事实性和准确性”相违背，事实上这个问题无解，因为无论什么搜索都不太给出100%完全准确的信息，作为信息中间商，自然也面临这个问题，但他们商业包装会让用户认为信息足够权威准确。

CEO过往的争议行为：Aravind Srinivas曾通过伪装成学术研究者的方式，利用X的API获取数据，涉嫌欺骗，此外，尽管公司声称正在与出版商开发收入共享计划，但实际并未采取有效措施。
如果说Perplexity是优势在于让“搜索引擎”更加好用，节省了用户时间，那么弊端也很明显：在某种程度破坏了互联网信任的基础，截取信息的同时给中小网站的收入带来打击，而在GenAI突飞猛进的今天，用户或投资者似乎还未关注到这个问题。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴