来源:市场资讯
(来源:数科星球DigitalPlanet)
天团集结:斯坦福+波士顿动力,音频赛道的顶配创业班底。
@数科星球原创
作者丨苑晶
编辑丨大兔
当生成式AI席卷内容行业,音频赛道正迎来一场无声的革命。
一款来自硅谷、由a16z重磅加持的AI音频产品Sun,以“液态内容”为核心,打破传统播客、有声书的边界,让用户自主生成专属音频内容,实现从“消费固定内容”到“创造个性化成长内容”的跃迁。
它的创始人,是一位拥有哈佛CS学位、深耕沃尔玛实验室与Adobe的连续创业者;它的团队,集结了斯坦福、波士顿动力、亚马逊播客的顶级人才;它的初心,源于一个极客对哲学阅读的困惑,最终长成瞄准全球7亿音频用户的赛道新物种。
这不是一款播客工具,而是一个以AI为内核、以个人成长为目标的“音频内容操作系统”。
在AIAgent与生成式内容融合的2026年,Sun正在重新定义:人该如何以最健康、最高效的方式,获取知识、完成蜕变。
本次,数科星球DigitalPlanet深度对话Sun创始人Artin,我们将这场纯英文采访记作中文,他如何取得a16z的青睐的?让我们一探究竟。
(Sun创始人Artin)
01
全球音频消费市场,等待一场生成式革命
根据QYResearch与格隆汇联合发布的《2025全球语音类AIGC市场报告》显示,2025年全球语音类AIGC市场规模已达“66.25亿美元”,预计2032年突破139.76亿美元,年复合增长率维持在12.3%以上。
而在更细分的音频内容消费领域,一组数据更具冲击力:全球有“7亿人”定期收听有声书与播客,其中35%的用户聚焦非虚构类知识内容,这一市场正以“27%的年增速”持续扩张。
在中国市场,AI配音已渗透90%车载导航、80%手机地图与40%有声书内容,用户对AI音频的接受度远超全球平均水平。
但繁荣之下,行业痛点从未被解决:
内容固化:传统播客、有声书时长僵化,10小时的书籍、3-4小时的节目,无法适配碎片化场景;
体验粗糙:音色单一、内容过时,硅谷热门播客;
《Acquired》2023年的英伟达专题,早已跟不上这家芯片巨头的迭代速度交互缺失:用户只能被动收听,无法实时提问、无法定制内容,更无法获得贴合自身需求的个性化推荐;
版权困境:AI模型大量使用原创内容却不付费,创作者权益得不到保障,内容生态陷入恶性循环。
数科星球DigitalPlanet长期追踪AI内容赛道发现,绝大多数玩家都在“优化现有音频体验”,却无人重构音频内容的生产逻辑。
直到2026年4月9日,一款名为“Sun”的AI音频应用在硅谷上线,彻底打破了这一僵局。
Sun的定位极为清晰:“它不是音频内容的搬运工,而是音频内容的生成者;它不卖知识,而卖“个人蜕变”;它不做固定内容的容器,而让内容变成可流动、可定制、可交互的‘液态形态’”。
上线不足一月,它已获得a16z(AndreessenHorowitz)、UltraCapital、PSV等顶级机构投资,成为a16zSpeedRun加速器录取率仅0.3%的项目中,唯一聚焦生成式音频的选手。
更具故事性的是,这家野心勃勃的初创公司,起源于创始人Artin一次“读不懂圣经”的私人困惑。
(Artin举办的聚会曾被Bloomberg报道)
02
哈佛极客的哲学困境
Artin出生于乌克兰,成长于俄罗斯,在硅谷生活17年,拥有亚美尼亚血统,妻子是来自中国深圳的工程师——这份跨文化、跨领域的履历,注定了Sun从诞生之初,就带着全球化与人文关怀的基因。
在创办Sun之前,Artin的人生轨迹是典型的硅谷精英路径:哈佛深造后,先后加入Adobe、沃尔玛实验室,负责全业务线的预测系统——小到未来1小时的销量,大到5年内的成本、库存、人员规划,天气、演唱会、突发事件等所有影响业务的变量,都在他的模型计算范围内。
长期与数据、算法打交道的经历,让他习惯用理性解构世界,但一次偶然的哲学探索,让他陷入了感性的困惑。
他的父母都是基督徒,他却从未完整读过一遍《圣经》。
2023年,他买下66卷《圣经》,试图从头研读,却很快发现了硬核痛点:宗教典籍晦涩难懂,需要大量查阅注释、背景资料,单纯的文字阅读效率极低。
一个极客的本能,让他做出了大胆的尝试:“用蒸馏出一个耶稣模型”。
他收集东正教、天主教、不可知论等多个版本的圣经数据集,投喂给LLM大模型,打造出可对话的虚拟形象。
最初,他只是与“数字耶稣”双向问答,就像使用ChatGPT一样——“我提问,它回答”。
但很快他发现,这种模式存在致命缺陷:“人永远不知道自己不知道什么,被动问答无法完成系统性的知识输入”。
于是,Artin对模型进行微调,让“数字耶稣”从“对话者”变成“授课者”:无需主动提问,只需安静聆听,有疑惑时再交互。
这种“主动输出+被动聆听”的模式,让他彻底打通了宗教典籍的学习壁垒。
随后,他将这一逻辑延伸到道家、佛家哲学,延伸到尼采、康德等哲学家的思想体系,一个全新的产品雏形,在他的手机里诞生了。
他找到自己的CTO——一位康奈尔大学毕业、曾任职波士顿动力、GoogleX,且成功出售过公司的技术天才,向他展示这款能生成哲学音频的APP:“你可以搜索所有哲学内容,也可以自己生成。”
CTO的一句话,成为Sun的“顿悟时刻”:“为什么不让用户从一开始,就生成自己想要的一切?”
他瞬间醍醐灌顶。
从“为自己生成哲学音频”到“让所有人生成任何音频内容”,Sun的核心逻辑就此确立。而这个源于私人阅读需求的创意,最终长成了瞄准全球音频市场的革命性产品。
03
天团集结
硅谷创业圈有一条铁律:“早期项目,团队比idea更重要”。
a16z在投资Sun时,核心决策依据之一,就是这支集结了哈佛、斯坦福、波士顿动力、亚马逊播客的“音频领域顶配团队”。
该公司的CTO是波士顿动力+GoogleX的硬核技术派。
此前曾成功创办并出售科技公司,在机器人、多模态模型、音频算法领域拥有10年以上研发经验。
他的加入,解决了Sun从“创意”到“产品”的技术落地难题:如何让大模型完成从信息抓取、事实核查、内容结构化到语音生成的全链路闭环,如何保证长音频生成的稳定性与流畅度。
斯坦福+亚马逊播客的内容专家Amy是Artin在斯坦福的旧识:当年斯坦福教育学院邀请Artin担任嘉宾讲师,Amy作为听众与他相识,此后一直保持联系。
Amy拥有斯坦福学习设计硕士学位,”是亚马逊播客的创始工程师“,深耕音频内容行业多年,深谙用户音频消费习惯、内容生产逻辑与社区运营规则。
她的加入,让Sun避开了“技术导向忽略用户体验”的坑,确保产品既硬核又好用。
Matt是一位斯坦福博士,也是音频领域深耕者第三位联合创始人Matt,更是斯坦福大学博士,长期专注于音频技术与内容创新,与Artin、Amy形成“技术+内容+音频专业”的铁三角组合。
三人的背景覆盖了AI算法、产品设计、音频内容、商业落地,完美补齐了生成式音频赛道的所有能力短板。
Artin在接受数科星球DigitalPlanet专访时坦言:“VC不缺idea,缺的是能把idea落地的团队。我们每个人都在自己的领域深耕多年,知道音频行业的所有痛点,也知道AI能解决什么问题。这是我们能拿到a16z投资的核心原因。”
这支团队的另一个独特标签,是”中国基因“:Amy是华人,Artin的妻子是深圳人,儿子也深受中国文化熏陶。
Artin直言:“我深爱中国文化,中国人勤奋、务实,对新技术的接受度全球最高,这也是Sun一定要进入中国市场的原因。”
04
“液态内容”成长引擎
打开SunAPP,你会发现它与传统播客、有声书平台完全不同:“没有预设的内容库,没有固定的节目列表,用户的每一次使用,都是一次全新的内容创造”。
Artin将Sun的核心价值总结为:“音频是最健康的信息消费方式,而Sun让音频内容变成“液态”——无固定形态、可定制、可交互、可成长,最终服务于人的自我蜕变”。
该产品直击行业五大痛点,并重新定义了音频体验。
在Sun在研发初期,做了大量用户调研,收集了有声书、播客、音频课程的所有用户抱怨,并针对性解决:
传统音频痛点
Sun的解决方案
内容时长僵化,无法适配碎片化场景
支持自定义生成1分钟至2小时的音频,单日最高可生成10小时内容
音色单一、收听体验差
多音色可选,未来自研专属音色,加入音乐层增强体验
内容过时,无法同步最新信息
实时抓取全网数据,事实核查后生成最新内容,永远“不过时”
被动收听,无法交互
收听中实时提问,APP内直接解答,无需跳转第三方工具
内容同质化,无个性化推荐
绑定笔记工具、ChatGPT,学习用户习惯,推送贴合成长目标的内容
它的特别之处在于,从“我找内容”到“内容为我而生”。
Sun的产品逻辑,彻底颠覆了传统内容消费的“搜索-筛选-消费”模式,取而代之的是“生成-交互-成长”的闭环:
它可以一句话生成专属音频用户无需搜索现有内容,用户只需通过语音或文字输入需求:比如
“生成一期15分钟的《硅谷ToC初创公司融资指南》播客”
“生成1小时的《康德哲学核心思想》音频课程”
“把《孙子兵法》生成适合通勤听的30分钟解读”
Sun的多模型系统会自动完成“全网信息抓取→数据清洗→事实核查→内容结构化→语音生成*”,最终输出带有故事弧光、音乐层、多视角解读的专业音频。
内容形式可自由切换:单人讲述、双人辩论、课程讲解,完全由用户定义。
其次,该平台还支持实时交互,以后可以边听边问。比如“刚才提到的a16zSpeedRun项目是什么?”、“融资指南里的SAFE票据如何理解?”,Sun会在APP内直接解答,无需跳转ChatGPT或搜索引擎,实现“一站式音频学习”。
第三,这个平台还可以个性化成长推荐,做你的私人顾问。
Sun的核心灵魂,藏在开机引导的两个问题里:“你是谁?你想成为谁?”
用户填写目标后,Sun会持续学习用户行为:绑定Notion、Plot等笔记工具,提取用户的学习、工作需求,主动生成贴合成长目标的内容。
Artin分享了一个真实场景:他深夜在办公室加班,妻子提醒他注意家庭关系,随后Sun就推送了一期“《创业初期如何维持健康的夫妻关系》”音频——这种极致个性化的推荐,只有生成式AI能实现,因为它不受限于现有内容库,而是“为用户量身创造”。
然后,这个平台本质上不替代原创,而是让内容流动。
Artin反复强调:“Sun不想取代记者、内容创作者、出版商,我们只想让内容变成‘液态’。”
传统内容是“固态”的:固定篇幅、固定音色、固定形态,无法适配不同场景;而Sun让内容变成“液态”:可长可短、可听可问、可定制可改编,同时与德国顶级出版集团合作,将纸质期刊、杂志转化为液态音频内容,既保护原创版权,又提升内容利用率。
Sun默认用户生成的内容公开,Premium用户可设置私密。用户可查看社区热门内容,关注专业创作者;
平台则与创作者合作,拆解其核心内容,在用户生成相关主题时推荐原创内容,并像Spotify一样向创作者支付版权费用——这与其他AI平台“无偿使用原创内容”形成本质区别,构建了健康的内容生态。
05
只做最优解
为什么是音频?
对于这个问题,Artin给出了终极答案。
在视频、图文横行的时代,Sun坚定选择音频赛道,Artin的理由简单而深刻:““音频是最健康的信息消费方式。开车、洗衣、通勤、运动,无需占用视觉,无需专注屏幕,随时随地都能学习。它不干扰生活,却能悄悄完成知识输入。”
这一判断,切中了当代人“碎片化时间无法利用”的核心痛点。而Sun的出现,让碎片化时间的价值,被发挥到极致。
此前,外界曾猜测Sun是“基于ChatGPT的套壳产品”,但Artin明确否认:“Sun是多模型编排系统,不是单一模型,更不是简单的接口调用。”
针对不同内容主题,Sun的技术流程会动态调整,最多可达160个步骤:
科学类内容:自动抓取学术论文、权威期刊,确保专业性;
历史类内容:匹配史料、文献,保证真实性;
商业类内容:实时抓取行业数据、最新动态,确保时效性。
整个流程分为四大模块:
信息抓取Agent:全网爬取权威数据,对接自有数据集;
事实核查模型:清洗虚假信息,验证内容准确性;
内容结构化模型:将零散信息整理成有逻辑、有故事弧光的音频脚本;
语音生成模型:文本转语音,加入音乐层,优化收听体验。
在基座模型选择策略重,它采用了自研+开源+顶级模型,从而实现了最优组合。
Sun不绑定单一模型,而是采用“混合策略”:它在核心推理环节重会使用高推理能力的商业大模型;在信息抓取环节,它则使用了自研爬虫Agent;
为了照顾到成本与速度,它加入了高效的开源模型;最为关键的是在语音合成(TTS)环节,未来将全面自研,70%的成本来自语音模型,自研可大幅降低成本,同时打造专属品牌音色。
Artin透露,团队已开始调研中国顶尖大模型,包括DeepSeek、混元等,计划将中国模型融入Sun的多模型体系,适配中文市场需求。
Sun的产品理念是“无摩擦使用”:用户无需上传文档、数据集,只需绑定日常使用的笔记工具(如Notion、Plot),平台自动提取数据,持续生成个性化内容。
目前,Sun已与百亿级硬件笔记公司Plot完成API对接,成为首批合作方,未来将接入更多主流工具。
这种“轻量化接入”的设计,让Sun摆脱了“工具型APP”的厚重感,真正融入用户的日常工作与学习。
06
双轨制盈利
作为一家初创公司,Sun的商业路径清晰而稳健:先免费获客,再逐步落地双轨制盈利,最终形成“订阅+credits+广告+创作者分成”的生态闭环。
最近,它采用完全免费的策略,意在快速积累种子用户。
据了解,Sun于2026年4月9日正式上线,,用户可每日生成5条音频,单条最长2小时,单日最高生成10小时内容,无任何付费门槛。
这种策略帮助产品快速积累早期用户,验证产品与市场的匹配度。
在后续,Sun将推出”免费增值模式“,在用户生成的音频中加入适度广告,进一步降低使用门槛,覆盖更广泛的大众用户。
同时,平台将对接广告主,实现基于用户兴趣的精准投放,提升广告转化率。
事实上,与其他AI平台不同,Sun坚持“使用原创内容必付费”:平台拆解创作者、出版商的内容,用于生成相关音频时,会向版权方支付费用,模式对标Spotify的流媒体分成。
这一策略,将吸引大量优质创作者入驻,形成“用户生成+专业创作”的双内容生态。
从市场空间来看,全球7亿音频用户、27%的年增速,足以支撑Sun的商业野心。
Artin表示:“我们聚焦非虚构类知识音频,这是35%的核心市场,用户付费意愿强、留存率高,是音频赛道的黄金赛道。”
07
0.3%录取率
在硅谷,a16z的SpeedRun加速器,是初创公司梦寐以求的“资本跳板”。
这个每年两期、每期录取60家左右公司的项目,录取率仅0.3%,低于哈佛大学、YC孵化器,是全球竞争最激烈的创业加速器之一。
SpeedRun为期11周。
Sun是本期SpeedRun中“唯一的生成式音频项目”,获得a16z领投,同时获得欧洲UltraCapital、PSV等基金跟投。
目前,团队正推进新一轮融资,已有一位知名华裔作家(ABC)承诺投资,后续将有更多顶级机构加入。
Artin透露,拿到a16z投资的核心,不是idea,而是”团队+产品+市场“的三重验证。
“VC不投空想家,只投能把梦想变成现实的人。”Artin的这句话,道出了硅谷早期投资的核心逻辑。
08
中文成为第一优先级
在专访中,Artin反复提及中国:“我爱中国,我的妻子是深圳人,我的合伙人是华人,我的儿子深受中国文化影响。中国用户对AI的接受度全球最高,这是Sun必须拿下的市场。”
从美食到文化,他深深认同中国Artin对中国的喜爱,这源于生活与合作的经历。
他妻子是深圳人,同意深爱中国美食,认为中餐是世界上最美味的料理;
他的合伙人Amy是他见过最勤奋的人,两人曾单日工作18小时,Amy的专注与努力让他敬佩;
他对于中国文化深感敬佩,中国五千年的美学、谦逊的民族性格、对技术的开放态度,让他深深着迷。
他甚至开玩笑说:“我的儿子长得很像中国人,这是我最骄傲的事情之一。”
对于Sun的未来,Artin有着宏大而温暖的愿景:“We’re all under the sun.We’re all enlightened together.(我们同在阳光下,我们共同启蒙)”
数科星球DigitalPlanet认为,AI的终极价值,不是取代人,而是”赋能人“;不是制造流量陷阱,而是”降低知识获取的门槛“;不是追求资本的狂欢,而是”服务于人的成长与蜕变“。
Sun的出现,让我们看到:科技可以有温度,算法可以有初心,商业可以有底线。在音频这个最贴近生活的赛道里,它用生成式AI,让内容变成液态,让成长变
2026年,是AI音频赛道的爆发元年。
Sun带着硅谷的技术、全球化的视野、中国的情怀,正在开启一场属于所有人的音频革命。
我们有理由相信,在不久的将来,当我们打开手机,不再搜索播客,而是说“生成我需要的音频”时,一个全新的内容时代。
热门跟贴