如果要给 23 年的 AI 市场一个关键词,那肯定是 “大模型”,聚光灯和大家的注意力、钱都投向了那几家大模型公司;而如果要给 24 年的 AI 市场一个关键词,则一定是 PMF。如果没有 PMF,AI 就会沦为一个 bubble。所以 PMF 会成为今年,甚至未来几年越来越重要的关键词。
去年大家投了很多背景优秀的创始人,最后能 deliver 结果和产品的却很少。很多人开始质疑 AI 到底行不行,市面上到底有没有有产品、有收入、有留存、有 PMF 的公司?而我们则渐渐开始看到一些 AI PMF 的影子。所以今年我们会开启一个新系列,每期对话几位验证了 PMF 的 AI 公司创始人。
本期是 AI PMF 系列的第一期,我们将介绍 AiPPT、ACE Studio 和 捏Ta 三款产品及其公司。AiPPT 上线半年单月收入达到数百万人民币,验证了国内付费 PMF;ACE Studio 开启付费半年,目前海外收入单月几十万刀,在海外验证了付费 PMF,而 捏Ta 则是已经有了超出互联网时代平均水平的用户留存,验证了国内的用户使用行为 PMF。
我们仍然坚信 AI 最重要的时间点就是 24 年和 25 年这两年,这两年会跑出来很多有趣的公司和产品,而下一个时代百亿美金、千亿美金市值的公司也就在这些之中。所以,希望这个系列节目能给这个行业注入一些信心,也给关注 AI 的人带来一些启发。
另外,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击文章底部的阅读原文或扫码,获取报名链接(里面也有 AI 私董会介绍和目前已加入的成员名单,可点击查看)
一键生成 PPT 的 AiPPT
曲凯:我们先给大家介绍一下 AiPPT 的用法吧。
赵充:AiPPT 目前有两类使用流程,一种是你说一句话,AI 自动生成大纲和生成 PPT。第二种是你将写好的Word、PDF、Xmind 等直接导入,然后据此生成 PPT。风格上你可以自己选择你喜欢的 PPT 模版,简约的、卡通的、中国风的都有。
另外马上我们还会上第三个比较传统的流程,模板库,我们提供上百万的 PPT、Excel、Word 模版,用户可以挑选下载。
曲凯:现在数据大概怎样?
赵充:去年 8 月上线,11 月过 100 万访问量,今年 4 月访问量在 350 万左右,大概这个进度。
曲凯:非常快啊,怎么做到的?
赵充:因为它是上来就赚钱的产品,所以只要是 ROI 为正,就可以一直去放量。现在收入大概是几百万一个月,之前基本是每月翻倍地在涨。
曲凯:市场上大家经常提的有 PMF 的产品是两个,一个是 Perplexity,一个是 Character.ai,但其实美国那边 Gamma 也很火,而且它数据也很好,对吧?
赵充:对,因为这个品类市场更大,微软收入几百亿美金,国内金山是 1000 多亿市值的公司,去年收入大概 46 亿人民币。面对这样一个更确定的市场,很多人就会觉得巨头太大了,没有创业公司的机会,不敢进来。
但事实上这个业务的变现情况不错,用户挺爱买单的,我们付费率比之前的工具类产品都要高,和金山的付费率差不多。
曲凯:所以用户现在确实是对 AI 生成的质量满意的?
赵充:满不满意不好说,但用户确实是愿意买单的,一是在 Word, Excel, PPT 三件套里,PPT 是最好变现的。它是做价值彰显的门面嘛,对外汇报、升职加薪,都得用。
二是 AI 打工感也比较强,你看着 AI 在帮你写大纲,一页页地写 PPT,自然就愿意掏钱了。
曲凯:所以到哪个点你确认,AiPPT 这个产品找到了 PMF,可以持续放量了?
赵充:月收入 100 万的时候,就感觉可以再加码了。
曲凯:你主要关注哪些数据?
赵充:付费率、ARPU、流量获取成本。本质上可以赚钱,就说明可以放量。
曲凯:但 AiPPT 典型的场景和用户群是哪些?我其实想不到身边到底谁会用 AiPPT。
赵充:其实我们的核心用户群跟 Office、金山是岔开的。Office、金山的核心用户是那些高频使用 PPT 的人,其中很多是用 PPT 去赚钱的,比如说投行、4A 广告公司这种需要把 PPT 做得很好,去客户那儿做 presentation 的。但我们的用户群并不一定是高频做 PPT 的人,他可能一年就做个两三次,甚至很多人这辈子第一次写 PPT 就是用 AiPPT。因为之前的金山或者 Office 其实使用门槛比较高,而 AI 来了之后,大家写 PPT 的流程变了,可以用对话的方式直接去做,门槛大幅降低了。
比如我一个朋友刚问我要个 VIP 会员,说要帮孩子写家庭作业。
曲凯:但你会不会担心频次问题?如果你的用户一年只做两三次的话。
赵充:其实不担心,频次问题可以通过产品矩阵来解决。比如我们 Q2 会上线文生图、文配图、文生表、文生文、虚拟人,以及协作功能,这些功能上了之后留存自然就上来了。
曲凯:现在在 AiPPT 里, AI 大概占了产品多大的比重?起了多大的作用?
赵充:10%-20% 吧。现在 AI 主要解决的是大纲的环节,整个后面的 workflow 包括内容全是我们自己的产品。但是没有 AI,这个事就不成立。因为在用户体验上 AI 的打工感贡献了 50%。
之后 AI 占比还会增加,比如我们未来可能会做各种多模态内容生成,会外挂知识库,以及 Q3、Q4 会做大模型直接生成 PPT —— 之前我们的逻辑是 AI 生成大纲,然后大纲和内容做匹配生成 PPT,未来可能是跳过大纲,直接生成 PPT。
曲凯:你会担心未来大模型自己把这个事做掉吗?
赵充:大模型是个技术,它不是一个产品嘛,核心我们还是解决产品问题。本身我们也有股东是做大模型的,所以自己也能打这个仗。
曲凯:你觉得 AiPPT 的核心竞争力是什么?
它的竞争主要看三个维度:用增、产品 (又包括 AI 和 workflow)、内容版权。所以我们希望在国内一直顶着行业第一的用户量,用户量越大,产品矩阵越完整,变现能力越强,然后就有更多资金去做用增,内容供给体系和版权资源也会越强,它是这样的一个正向循环。
曲凯:版权方面,其实视觉中国是你们的股东,对吧?在版权上能帮到很多。
赵充:对,视觉中国应该是国内最强的一个战略玩家,我做爱设计这个项目引入的第一个战略资源就是视觉中国,因为版权上不能出问题,尤其是我们现在的商业模式,除了自己做之外,也会把 API 和版权输出给很多大厂,大厂最不能容忍的就是你版权上有瑕疵。PPT 配图上也能用它的库,所以有视觉中国保驾护航,我们就更容易去跟渠道、合作伙伴去谈合作。
曲凯:我这里 challenge 你一个问题,如果未来能直接 AI 生图,现在已有的这些图片的版权价值会不会越来越低?
赵充:图片可以拆成两类,一种是写实的,一种是现做的,写实的部分其实就完全不受影响。而现做的部分 AI 生图也还是要基于素材库,视觉中国有很好的原始素材,也能帮我们生成更好的东西。
曲凯:明白。另外你其实已经是一个很成功的连续创业者了,你的上一家公司微梦传媒做了十几年,也有十来亿的收入,我不知道在你看来,这波 AI 的机会跟你之前十多年移动互联网创业的经验比起来,有哪些相同和不同?
赵充:其它行业我不太懂,也不好说,说回到办公赛道上的话, AI 带来的最大不同是改变了用户生成文档的工作流程,用户不再需要打开一个白板、拽图标、做对齐,这就打破了传统 Office 厂商 1000 个 feature 的优势,这是一个很大的机会点。所以我们是有机会在一个很大的市场里抢个几个点的市场份额的——WPS 46 亿收入,利润 13 亿,微软更大,所以只要在这个 4000 亿的市场里能抢两个点,就是一家妥妥的上市公司。
曲凯:在整个 AiPPT 创业过程当中,你觉得做得最对的事情是什么?
赵充:我们很大的一个决策优势是有炮弹持续能赌吧。
我们其实是从投资视角去打这个仗的,创业的形式也是项目孵化的形式。
首先自己做市场研究,用华为的 “五看三定” 去看项目该不该立,ROI 是多少,包括竞品分析、潜在市场规模、用户调研、如何推广等等都是先分析好的,有标准的立项流程。只要成功概率大于百分之六七十,这个枪就可以开。
市场调研的工作我做完,然后找到在领域干过 10 年以上的人来当操盘手,相当于我出钱组队,以阿米巴的方式成立一个个项目组,然后迅速把这些项目跑起来。
一般小团队可能只有打一枪的机会,但我 22 年投了三四个内部的项目,相当于开了三四枪,每一个项目大概是 500 万以内的预算。加上本身有个赚钱的公司在,所以相对从容一点,对犯错的容忍度高一点,这也能给团队带来一些可能性。
曲凯:我觉得你还有一件做得特别好的事是非常重视各种渠道资源。因为你其实本身就是做广告流量相关的,体量也很大,对此应该很有经验。
赵充:对,中国所有的互联网大厂,只要到一定市值,都是我们的客户,所以增长是我们团队的一个核心能力。国内的整个流量生态的分布在哪儿、谁在管、获客成本多少,都比较了解,也踩了很多坑,所以我们是先考虑增长渠道,再开始做产品的。
曲凯:你们这些创业了十多年又赚到过钱的人,对现在的创业者就很不友好,完全降维打击 (笑)。本来一个典型的 AI 创业者,可能 10 个人的小 team,做个半年一年,好好打磨产品,然后上线。上线以后再去想该怎么推,怎么拿到下一轮的钱。下轮能拿到钱可能也就拿个 200 万刀,但在这个时候可能你都已经把面全都铺开了,该拿的资源都拿到了,就已经非常以终为始地在做这个事了。
那对你来说,在这个过程中你最关心的问题是什么?花最多精力的问题是什么?
赵充:我其实核心还是从用增视角去看我应该跟谁合作,怎么更好得组织资源去打这个仗。比如我们引入视觉中国,引入大模型厂商,也希望引入一些平台厂商进来,其实就是出于这个视角。
曲凯:所以听下来,我觉得你非常擅长找到一个问题的关键,而且能搞定这个关键资源。我可以这么理解吗?
赵充:对,但其实就是因为上一次创业没能整合市场上最好的战略资源进来。
当时作为一个平台生态公司,只有平台进来帮你,才能吃下最大市场。但那时候太年轻了,没意识到。就做一个独立第三方,哼哧哼哧干了十年,也就那样。如果再让我重新打一次,我肯定做最好的 PPT 去 pitch 下来那个资源。
曲凯:所以你现在做 AiPPT,你觉得是站在上帝视角的吗?
赵充:我觉得比上一次成熟一点。
曲凯:更接近上帝了?
赵充:不好说,所以为啥要跟这个朋友们多聊一聊,我问了无数朋友这个问题,如果他是 AiPPT 的老大,他打这个仗要怎么打?有上市公司老板,有我们的股东,包括曲老师,对吧?
其实就是产品运营这些执行上的事就交给团队去弄,我还是搞定最核心的战略性的合作,这些弄完,仗就赢了一半了。
曲凯:但我再 challenge 你一个问题,就我觉得很多人,尤其是做 VC 的人,大家会先天有一种感觉是说如果一个创始人特别靠资源,就会觉得好像不那么对劲。我不知道你是怎么看这个问题的?
赵充:会这么想的人,都是因为他听了太多的故事,而这些故事都是某些公司故意立的人设而已。CEO 是解决什么问题的?CEO 你不能把自己降维成一个产品经理,如果你降维成一个产品经理,说明你没找到一个好的产品 partner 去帮你带这个事情。CEO 最主要的角色是组织以及链接公司内外部资源,而不是说向下补位,去补增长,补产品,补运营。我们内部都是讲说你事业部总经理不要去干一个总监的活,你总监不要干一个客户经理的活。如果你向下降维去做了下一层的事,说明你在招聘这件事上没有用力,你在这个岗位上没有招到最好的人。
曲凯:但你在上一家公司刚成立的时候也是这样的吗?我在想为什么我们碰到的很多早期创始人不是你这样的,他们可能就是没有足够的本钱去招到那么好的人,必须要自己顶上。
赵充:我觉得是他在招聘上没有花足够多的时间。我在研究一个公司的时候,一个公司可能会被我面 50 个人,除了老板都面完。现在我有 10 个 HR,他们都领着任务,我看到哪个目标公司的业务我想打了,就让 HR 把市面上所有的相关简历全部找出来,我全部聊完。我不相信下面人聊的东西,全是我自己聊。
曲凯:这也就是你说的市场调研,对吧?其实你会去聊很多实际做事的人。
赵充:对,比如一个小项目,我会在市面上做 Mapping,找出 10 家公司,每家公司聊 10 个人,做增长的、内容的、产品的、技术的,把这些信息从各个角度拼凑起来之后基本上就是一个商业计划书,就能判断这仗能不能打。然后再在这 10 家公司里挑出几个操盘手,做好资源组合,共创商业计划。你给他足够多的信息输入,他有经验,也认可你说的资源组合方式和激励方式,然后就干。
曲凯:你的激励方式具体是?
赵充:很简单,比如项目能挣 5,000 万,那拿 500 万,大家直接分了就行。我们吸引的这些核心人才都是大厂背景,只要他们能干好,待遇比大厂多一倍、两倍都有可能。他自己有本事,想追求更高的上限,那加入我们是很合适的。
AI 音乐制作工具 ACE Studio
曲凯:我们先给大家简单介绍一下 ACE Studio 吧。
Joe:我们公司叫时域科技,19 年初成立时,我们就想通过 AI 让每个普通人都能创作音乐。在经过很多产品形态、技术形态的探索后,最终我们在 23 年推出了面向 professional consumer 的 ACE Studio,能让用户生成具有出品级质量的 AI 歌声。未来我们会进一步把它打造成一个 all in one 的 AI 音乐工作栈,让每一个人都可以在这里创作歌声、伴奏,把歌曲打磨到出品级质量。
曲凯:现在的 ACE studio 很像一个专业的音乐制作软件,对吧?我觉得它最有意思的地方是,我不管填了什么词,都可以选择一个声音真的把它唱出来,而且唱得很准。
Joe:对,这个是由真实的用户需求演化来的。如果有人要做一首歌,歌曲里其它所有要素都可以用一台电脑完成,唯独真人演唱环节,要么得这个音乐人自己,要么得找其他人进录音棚里唱。这是一个非常不优雅的过程,时间、金钱成本也都很高。于是我们发现歌声可能是 AI 音乐里一个最优、最好的切入点。
曲凯:所以一句话概括,你们现在在做的是「真人歌手的平替」。那你跟 Suno,Udio 这些 AI 音乐软件的核心区别是什么?
Joe:简单讲,你用 Suno 的时候,刚开始会很嗨,你输入了一些 prompt,出来一个结果,这个结果很美妙。但当你非常严肃地想用它来创作一些好内容的时候,你总会发现其中有 15% 的东西不尽如人意,而你没办法对它进行二次修改。你修改一点点 prompt,它的结果就完全不同。
我们希望打造的东西是,有 Suno 的能力,简单输入一个 prompt 就能产生一个 85% 好的东西,但此外你还可以继续对这 85% 进行修改,直到达到你理想中的 100%。
曲凯:对,我们之前有一期播客也在聊 AI+音乐,当时就想用 Suno 生成几段歌曲用到播客里,但总有各种各样的问题,试了 100 多首歌才能挑出来一个小节。所以 ACE Studio 就可以精确地修改一个词,一个音符,一段旋律,而不是不断地掷色子。
Joe:对。我们比较相信这才是 AIGC 产品的未来。AI 创造的内容不是成品,是人创作的素材,这些素材交到创作者手里做二次加工,之后才能产生更大价值。
拿视频生成举例,Sora 生成的只是一些美妙的镜头,镜头和视频之间有很多 gap,这些 gap 靠的是叙事,是故事,是创作者注入的 humanity。音乐也是一样,比如 “你好,我有一个帽衫”,为什么是这个词曲此时此刻触动了全网用户的神经呢?当每一个人都能用 text to music 生成 80 分的、Suno 水平的作品时,那真正能 set apart 的一定是有灵魂的,融合了非常多精妙元素的作品。
所以目前单一模型打遍天下的路子可能很快会结束,未来模型只是产品里的一部分,而产品需要有成熟的创作工作流,这是我们比较相信的未来。
曲凯:现在各种文生图、文生视频,其实都有一个链条。这个链条里大概有三个角色,一是模型本身,它能够生成内容素材;二是一些专业的创作工具,比如 ACE Studio,剪映等等;三是实际的消费平台。那么在这个链条上,这三个角色谁才是链主,谁又会被整合吃掉?
Joe:很好的问题。我们可能得先放下消费平台这个角色,它跟生产工具之间的关系太暧昧了,什么样的情况都有。有同时做消费平台和生产工具的,比如剪映 & 抖音,快手 & 快影,也有独立做生产工具的,比如 Adobe。
我们只看模型和产品之间的关系,而这个的核心我认为在于模型难度。如果模型是一个城堡,产品就是围在城堡外面想要攻陷城堡的野蛮人,城堡的城墙越高,维持时间就越持久。
我们可以做一个思想实验,假设今天的文生图特别简单,随随便便就能做出 Midjourney 的效果,那接下来是不是应该百花齐放地出现各种各样的产品创新模式,像妙鸭就是其中一种。但目前因为模型壁垒足够高,所以产品的创新被抑制了。
而音乐大模型,模型壁垒没有那么高,我们打听下来,做出 Suno、Udio 这样的效果,真正的算力成本可能就在一两百万美金的水平——即使有点乐观了,也就是乘以 2,乘以 3,一个 A 轮创业公司就可以搞定的 level。
未来会不会出现 OpenAI 下场,scaling law 打爆一切的那一天,也悬。因为全世界人类历史上创作出来的歌曲可能也就几千万首,几百万小时,这个规模大概是 100 张 A100 迭代一次、两三天的水平。100 张 A100,租的话可能一个月几十万到上百万人民币,不便宜,但创业公司也还玩得起。
曲凯:对,所以还是看模型难度。文生视频和文生文的 LLM 足够难,所以会出现模型主导产品的情况。但音乐的模型其实不难,大家都能做出来一个类似的东西,更重要的就是后面的工作流。
另外 ACE Studio 的商业化也已经做得非常好了,目前应该是有单月 7 位数人民币的收入,而且你们商业化时间也就才几个月,涨得非常快。这是怎么做到的?
Joe:都是血泪史。
我们是 23 年 10 月份正式收费的。之前我们拍脑袋认为,请一个歌手一次 500 块钱,买了我们软件一年用两次就已经回本了,所以定了个 1000 块钱的年会员价格。
然后我们发现,对我们有需求的用户很多,但是付费转化率不高。用户在掏钱的一瞬间有很多纠结,比如买了不会用怎么办。最后我们的新增付费率是 1%-1.5%,新来 100 个人有 1-1.5 个人付费,而且月卡买的多,年卡买的少。
于是我们就想,音乐人,或者叫做 music creators,大概是个什么样的群体?我们自己体感一下,你朋友里面有几个音乐人?很少。但是全球的音乐人有 1500 万之多,几乎相当于 UI 设计师的数量。你想一下你朋友里面有几个 UI 设计师?挺多的,对吧?至少你肯定认识几个。
那这些音乐人都在哪儿?答案是都在海外。
我们发现网易云的注册音乐人有 50 万,里面还有大量的翻唱歌手,制作人可能只有 10 万左右。但是 Spotify 里,这个人数是 1000 万,而海外不仅有 Spotify,还有 YouTube music、Apple music。进一步到 YouTube 上搜类似 music production 的关键词,很多写歌、做歌的人,有几十万或者是大几百万的粉丝。你很难想象在中国一个教别人怎么制作音乐的网红有 100 万粉丝,这是两个完全不同的土壤。第一性原理讲,那边大得多。那我们为什么不去那边吃肉呢?
所以我们就赶紧搞海外市场。我们第一个想法是直接去联系这类 Youtuber。我们让 ChatGPT 帮忙梳理了一下,然后用我们非常一般的英文跟他们说,你能推广一下我们的产品吗?
联系了将近 100 多个 Youtuber,没有一个人回复。当时我们都绝望了,这海外也太难搞了。
但是后来,我们做了一个比较有趣的决定,就是我们想出去看看,看看那一片土壤究竟是怎么回事。其实这个决策是非理性的,但现在事后复盘,这非常重要。
当时我们很紧急地报名参加了全球最大的音乐行业展,叫 NAMM Show。那个时候我们想,就算没有展台,自己脖子上挂个板子,也要在那跟人家展示。幸运的是,有一个展台空出来了。我们花了三天时间制作所有的物料,自己托运,什么优惠券,什么宣传册,做得还特像样,特漂亮。然后在那边现买电视、买音响,最后搞定了这个展台。
然后很有趣的事情发生了,在这个展会上经常会出现一些看似貌不惊人的美国人过来跟我们聊,他们无一不是两个反应:第一个反应就是 I can't believe it,我不相信这是真的,我不相信这是 AI 做的,也就是一种对我们的赞许;第二个反应是 I told you,就是这个人离开后又带了一个朋友过来,跟他朋友说 I told you,我没有骗你。他的朋友又 I don't believe it,然后又拉来一个朋友,I told you,开始无限循环。
更惊喜的是,LA 真是音乐大本营,这些人卧虎藏龙。当时大概有 100 个人对我们感兴趣并且留了联系方式,我们事后去查了他们的邮箱和名字,大概能对应出来 20 个以上的格莱美获奖或提名的人。虽然他们的口口相传并没有直接给我们带来多少新增用户,因为毕竟也没有多少人,但是他们给我们带来了一种被信任的氛围。
这之后,我们神奇地发现一些 Youtuber 回复了我们之前的邮件说,我的朋友在 NAMM 上看到了你们,我觉得你们很有趣,我们或许可以一起合作;甚至有更大的 Youtuber 主动发邮件给我们。到今天为止,我们也就投出了 5 个 Youtuber 的合作推广视频,平均单价在几百美金到几千美金不等,但是他们直接把我们的收入从原先几十万人民币顶到了几百万人民币。
曲凯:所以经历了几个月时间,你们现在核心的收入和受众就从国内完全转到了海外。
Joe:对,今年 1 月份的时候人民币收入占比还是 90%,现在美金是 90%。西方用户付费概率确实高很多。每 100 个新增的海外用户有 15 个人会付费。
曲凯:真的是一个很可怕的数据,基本是国内的 15 倍了。而且海外是订阅制,还有循环扣款。
面对这些用户,你们会直接说自己是中国人吗?
Joe:这个 Chinese exposure 的问题,在资本市场是比较难受的,我们和有些大公司聊合作的时候也还是会有一些问题,但面向 C 端的话我们发现大家并不在乎,顶多音乐节上大家会感叹一句说,噢,原来你们远道而来。
曲凯:你们团队之前都没有做海外的经验,但从联系 Youtuber 到去海外参展做也就是几个月的时间,现在海外市场就完全起来了,你觉得这是可复制的、大家都可以做到的吗?
Joe:从具体路径上讲是八仙过海,但是宏观上是可复制的,我们并没有更擅长出海,我们就纯纯一土包子。
曲凯:但我发现身边很多国内创业者,一提到出海,天然会有些害怕和抵触,觉得自己不懂。
Joe:确实,每个人都想在舒适圈里呆着,加上如果在国内又有一点点正反馈,可能就出不去了。
我印象很深,当时我沉浸在抖音上搞营销、卖软件的时候,跟一哥们聊天,他比我更早出海,他提醒我今天在国内看到的东西可能只是一小部分,出去的话更大。当时我还觉得我在国内搞也挺好的,后来就发现他是对的。
这其实特别像起床,起来,走出去那下特别难,但是起来之后,你会觉得其实挺爽的,早起挺好的,各方面都挺酷的。
我其实之前曾经在旧金山待过半年,但是那次也是啥也不懂,英语也不行,大学四级都没过,就硬去的,到最后跟投资人谈笑风生,在那边还跟几个美国人小创了一个业。
曲凯:可以。这期的主题就是四级都不过,也可以赚美国人的钱 (笑)。
所以从出海这件事本身来讲,你有没有什么建议,或者踩过的坑可以跟大家分享。
Joe:第一是要找到你的流量阵地,比如我们这个产品,流量阵地首先是 YouTube,其次是 Instagram。洛杉矶音乐圈儿拿 Instagram 不是当抖音,是当微信的,他们加私信都要加 Instagram。但这个可能就不是出海的大共识,大家之前觉得 Twitter 更重要,因为很多 AIGC 产品都是在 Twitter 上爆的,是我们出去了之后才知道洛杉矶音乐圈儿 Instagram 这么重要。
我们前期都是盲投瞎试,我们还投过搜索广告,亏得一塌糊涂,ROI 完全为 0。而现在那种 KOL 的视频, ROI 是100,产品没有任何变化,就是流量阵地变了。所以你得真的知道那些地方在发生什么,弄明白这件事,知道哪里可以获得流量。
曲凯:你觉得你们做得最好的几个点是什么?
Joe:还是要跟自己的用户待在一起,比如说我们有一个超级重要的功能叫做转谱,自己哼一段小样,它就能直接转成一段乐谱。
曲凯:这个我也有需求,我可能偶尔哼一段,但再过一个小时我就不记得了,因为我也不知道它的谱子。
Joe:对,有一种创作方式就叫哼唱作曲。他们懒得一个一个敲音符,你能更快地帮他提取他哼的谱子,对他的工作流就巨重要。就这一个功能,让我们的用户扩了一倍。
曲凯:这样的话,你觉得整个音乐产业,包括普通人跟音乐的交互最终会变成什么样子?
Joe:我觉得会像视频一样。今天还有音乐制作产业,有很多专业的音乐制作工具。但今天已经没有视频制作产业了,每个人都能制作视频。CapCut,也就是海外的剪映,有 3 亿的 MAU,它已经是个相当普适的东西了。
音乐为什么还没有变成这样的一个状态?从需求端我不能 justify。每个人都知道音乐,也几乎都喜欢音乐,而之所以少有人制作音乐,是因为供给端制作工具的门槛太高了,而今天 AI 可以改变这件事。
二次元角色创建平台:捏Ta
曲凯:捏Ta的产品演进路线是怎样的?
胡修涵:我们自己最早观察到了一个需求,就是大家想在二次元的场景中去做内容创作。22 年底,我们就发现有一群创作者在用 NovelAI 和 Stable Diffusion 早期模型画漫画,那时模型质量还很差,但他们动力很强。所以我们就想能不能给他们做一个漫画型的工具。而且对于需求侧来说,其实二次元的内容需求也一直都是相当大的一个消费场景。
第一版产品是 23 年 4 月份左右上线的。第一阶段,我们犯了一个推论上的错误。最早我们看到了一些自己做完自己消费的工具型行为,比如把角色做成壁纸美图,然后我们就想把这个行为往前推进一步,让用户做能给别人看的漫画。但最后发现很难,你无法牵引用户去做剧情化的表达。
我们看到的用户分两类。上层的高阶用户对产出内容的控制力和精确表达能力要求很高,AI 目前还达不到;下层用户就像刚才说的,他们只愿意消费,不愿意构思剧情。我们原来设想说是不是中间还有一层用户,他们基于 AI 辅助就能开始构思剧情,但事后证明是不太存在的。
曲凯:那回头来看,你到底相不相信 AI 能降低创作门槛,让消费跟创作更好地融合在一起?
胡修涵:我非常相信。
曲凯:那就是说现在创作门槛降得还不够低?
胡修涵:不,是创作要素拆得不够好。
内容创作分三个关键要素:创作的线索、创作的基本手法、创作的主体内涵。
以抖音为例,它的创作线索是卡点音乐模板,创作手法是拍摄加剪辑,最后的主旨定位是展现美好生活。
其中,创作线索是降低创作门槛的核心,而提供创作线索有一些非常 critical 的要求。一方面,它最终的呈现应该足够个性化,多样性,不能像上一代 AI 滤镜一样特别固定和局限。但另一方面,它也要保证足够易用,大家能用最简单的方式套用这个线索做出自己的东西。这是一对很艰难的 trade off。最开始我们提供的线索有点弱,可能只提供了一些 prompt 碎片,而 prompt 不足以产出更丰富多样的内容,满足个性化展现的需求。
再进一步,我们就开始仔细地观察用户。虽然我们第一阶段跑得不是很顺,但我们发现有一群用户会坚持用捏Ta,而他们坚持用的原因大多是出于对某个角色持续的创作热情,他们会长期地围绕着角色进行创作,把它变成自己幻想中的样子,变成一个能持续成长的东西。
曲凯:所以你们是去年发现有一批人真的在捏Ta上养娃,然后开始改产品。那现在捏Ta的产品形态跟玩法是什么?
胡修涵:我们后来通过 PGC 的方式提前预制了很多模板剧情,用户会首先基于个性化的方式来塑造一个角色,然后他可以让角色在这些剧情模板中呈现它的故事,也就是让角色进入一段段人物奇旅。角色本身的人设和性格会和剧情发生碰撞,一定程度上影响剧情的走向。
最终的产出是,用户可以在剧情的关键点上给角色拍照,这就得到了一段段漫画形式的人物故事。
曲凯:那 AI 是作用在哪个环节呢?
胡修涵:AI 起两个作用,一个是充当摄像头,对出演剧情的角色进行拍照 (AI 生图),二是 AI 模拟了这个角色本身的特性,它使得剧情中的角色能个性化地做出反应。而且在生成每次的画面和文字描述的时候,AI 会考虑这个角色原有的背景经历,用户会发现这个角色是有自己的故事和记忆的。
曲凯:那会不会遇到剧情收敛的问题?
胡修涵:它是个单线剧情,剧情的主体走向不会随角色发生很大变化。
曲凯:是因为现在 AI 能力不够吗?
胡修涵:不是,是我们决定这样。因为我们发现用户希望保持剧情的高质量,其实用户也可以强行引导来扭曲剧情的结局,但大部分用户没有这样做的动力。
曲凯:我的理解是,角色不会太大程度上影响剧情走向,但他们的临场反应不一样,有一定自由度,参与的剧情也会沉淀为它自己的记忆,最终我作为一个用户会感觉捏出来的角色厚度在增加。
我不得不说,你们试出来了一个非常小众,之前没太听说的需求和场景 (笑)。但可能 AI 时代就是要做出来一个比较新的,大家都想不到原来还可以这么搞的产品。
胡修涵:这个场景其实一点也不小众。它 literally 就是模拟人生的场景,而模拟人生是一个经久不衰的好游戏。它也是通过规则化的 AI 让你设定的角色能在一定的故事线上完成出演。所以这绝不是一个我们凭空发现的新场景。
我们自己总结下来,这一代 AI 的 PMF 核心要解决的是内容跨模态组合的问题,或者说跨多个数据来源组合的问题。基本上现在跑通 PMF 的类型都是这样,比如 Perplexity 是跨多个数据来源的有机组合,Character.ai 把原本角色的人设和用户的 prompts 做了重新组合。
这一代 AI 做原创的能力其实是不够的,它无法很好地找到最原始的那个创意。所以我们要让它从一个 creator 退化为一个 composer,这样才能产生高质量的内容。
曲凯:就它不是一个能 0-1 的事情,而是把好多素材组合在一起,再产出一些新的东西来。
胡修涵:对,AI 有很强的把素材从不可组合变成可组合的能力,可以利用这一点注入很多个性化要素。
人对个性化的感知其实很容易被 hack, 同样一句话,用你喜欢的方式重新说一遍,你就会觉得那是你自己的思考。所以我们很多时候是用 AI 的组合能力去 hack 用户的个性化感受,而不是试图让用户自己每次个性化地输入新的 prompt,这个成本和门槛太高了。
曲凯:你是什么时候确定自己找到了 PMF 的?
胡修涵:移动互联网产品有个经典指标叫 421,次留 40%,周留 20%,长留 10%。我们最早发现捏Ta的长留是 OK 的,一部分核心用户可能还高于 10%,但是次留和周留都很差,说明它的使用模式不高频,那相应的,它玩法的消耗次数不多,付费空间也就会打折扣。
而当我们把线索,就是刚才说的剧情模板这部分做好之后,每个用户的消耗次数一下子提升了,留存线全面越过了 421 指标。
此外,分享意愿和付费渴求度也有所提高。这个从用户投诉和反馈来看特别明显,最开始都是吐槽创作体验的,中间一段时间是吐槽原创角色功能的,到十一二月份吐槽社交私信,到今年大家都开始吐槽“体力”不够。我们的体力其实是自回的,反馈体力不够说明这段时间他的消费欲望非常强,否则等等就行了。
我一定程度上认可的点是,这一代 AI 产品一开始就要考虑商业化和广告植入问题,考虑推理成本。但过早对创作行为收费,是一个很抑制创作意愿的事,所以我们只是一直在试验付费意愿,没有真正做大规模商业化。目前我们是让用户通过点击广告等等方式来增加体力。
曲凯:这个体力设置和广告激励很有小游戏的感觉。
胡修涵:对,这都是游戏留下的一些经验。
再到上几个月已经出现了一些比较明确的续费和复购,我们就比较有信心说找到了 PMF,下一个阶段更多就是做增长和推广。
曲凯:所以你总结一下,捏Ta这一年多以来,哪些地方是做得最对的?
胡修涵:首先我们始终比较聚焦,没有泛泛地服务所有的创作类型。所以能比较深入地洞察用户,而不只是浅浅地聊聊天,谈谈反馈。
第二就是我们会在社媒上用内容给产品探路。因为内容是一个双边市场,它在需求端受不受欢迎很重要。可能有些内容,非常专业非常酷炫,但内容其实并没有特别多的普通内容用户来消费,更多是科技爱好者去尝尝鲜,这是没有什么生命力的。所以我们社交媒体上的内容会领先产品三个月,用这三个月去提前测试哪些 AI 参与制作的内容有 content market fit,这个比 PMF 的前置效率要高很多。
曲凯:我们讲了这么多,你怕不怕大家听完以后抄一个 捏Ta 出来,你觉得 捏Ta 的核心竞争力是什么?
胡修涵:核心竞争力是,在我们团队里,从需求洞察到模型侧的优化只需要一两个人就能完成,而其他团队可能需要三四个不同职能的人。或者也可以说,我们迭代闭环足够快,感知和行动部分的距离足够短。
之前影响力很大,我很同意里面的一个点,就是产品经理需要关注最底层的技术变化,因为技术会很大程度上影响你的战略决策,比如说判断现在是要去攻克视频生成能力,还是去优化一个用户使用的细节。所以只有当一个人,既是一线的业务了解者,又是一线的技术实操者,才能比较准确地判断用什么方式将技术落进产品里最合适,否则就会带来很多波折和损耗。
最后,如果你对我们的 AI 私董会感兴趣,可点击阅读原文或者扫描下方二维码,获取报名链接(里面也有目前已加入的成员名单,欢迎点击查看)
AI 私董会活动预告:
42章经
思考事物本质
热门跟贴