文:董指导
题图由文心4.5 Turbo生成
本期要点
#AI#AI 应用#百度智能云
AI开发者是最兴奋的一群人,因为他们看到了一个万亿空间的机遇;AI开发者是最焦虑的一群人,因为大模型已经过去两年,投资人、用户们的耐心似乎快要消退,但爆款应用却仍未出现。
这不禁令人思考:通往AI应用世界的大门,如何打开?如何更快迈入AI应用的世界?
01开发之旅,如闯三关
东市买骏马,西市买鞍鞯,南市买辔头,北市买长鞭。《木兰辞》的作者用“互文”的表达方式,讲述了出征前置办装备的繁忙与辛苦。
这也是应用开发者“出征”的写照。可以说,AI应用开发是一场充满挑战的旅程,“关关难过、关关得过”。
起点是产品设计。在商业创业史里,到处是空有一身技术、但却做出失败产品的案例。好产品,要能更好地切入用户需求。因此,场景选择就格外重要。
场景选择,如果不能识别行业痛点、不具备行业know-how,卒;如果不了解大模型,不知道能力边界在哪里、能解决哪些、解决不了哪些,卒。
产品设计关闯过去之后,就是应用开发:
选不对模型,卒;
提示词工程完成度差,卒;
数据质量不高、可用性差,卒;
逻辑编排不佳,卒。
而且,应用开发就像练武功一样,虽然招式看起来相同,但有的人能发挥得惊天动地,有的人却像放了一个屁。差异就在于,作为内功的工程化能力。不少人以为AI应用,尤其Agent开发,就是套层皮就好了,实际并非如此。一年半载的功夫,还是要下的。
应用开发关闯过去、产品上线后,并不意味着万事大吉。还要承接成本的压力。前段时间,OpenAI首席执行官 Sam Altman就在抱怨,用户对ChatGPT 说「请」和「谢谢」等礼貌用语,对Token的消耗,就让 OpenAI 增加了数百万美元成本。
用户怎么做,是难以控制的。但毫无疑问,推理阶段,如果控制不好算力成本,或者没有稳定的算力支持,那也是一个大烦恼。
产品设计、应用开发、上线运营,三大关卡又嵌套着多个小关,一路坎坷。而且,由于用户需求不断叠加、产品技术不断更新,开发旅程,也是一轮又一轮。
如何让开发之路,越来越好走?
02系统方案, 应运而生
系统化,越来越成为商业发展的主旋律。
比如在芯片领域,最初的集成电路是多个独立芯片互相配合运行,但自1990s以来,SoC(系统级芯片)技术,发展迅猛、成为主流。
SoC 将多种功能模块集成于单个芯片上,融合了处理器核心、图形处理器、内存控制器、各类接口以及存储器等组件。一款芯片,就是一个系统。
与传统集成电路相比,SoC 具备诸多优势。比如,性能上,可以避免芯片间信号传输的延迟,提升运算速度;物理层面,体积大幅缩小,功耗显著降低、也更适合做小型消费电子的开发使用;研发角度看,SoC 采用 IP 核复用技术,极大缩短了研发周期。
系统级的变化,让芯片研发更加便捷,下游使用芯片的成本降低了、效果提升了、意愿也提高了。
再比如在新能源车领域,域控制技术的兴起,也同样体现了系统级方案的趋势。
传统汽车的电子电气架构较为分散,各个功能模块相对独立,导致布线复杂、故障排查困难且升级成本高。
域控制,则将汽车的多个功能系统进行整合,通过少数几个域控制器来集中管理。比如,将车身控制、动力系统、信息娱乐等功能分别划分为不同的域,由相应的域控制器进行统一调配。
域控制的方案,不仅简化了布线,减少了车辆的重量,降低了能耗,还使得汽车的软件升级更为便捷。通过 OTA(空中下载技术),车企可以对车辆的部分功能进行远程更新,提升用户体验,也让汽车智能化发展加速。
系统级,一个通俗理解的角度,就是“一条龙”,把用户所需要的,都提供了。但又不只是简单的啥都做,而是通过有机组合,实现成本降低、性能提升。
他山之石可以攻玉。要让AI应用开发,更低成本、更高效,也许思路就是“系统级”的全栈方案。
03全栈迭代,创新不止
系统方案,要陪跑开发全旅程,而不是只走一段路。
支撑AI应用开发的系统,最底层是算力。没算力这个声音,应用再好的戏也唱不出来。它决定了模型可以发挥多少性能、以及花费多少成本。
然后,要有一个好的模型平台。所谓好,就是说不仅是个“模型超市”,提供种类丰富、性能优秀的多个模型供开发调用;有清晰的评价和引导,方便开发者选对模型。
也要是个“模型工厂”,支持开发者针对特定场景进行快速的模型优化、甚至定制化开发,最终让开发者,可以相信模型、大胆使用模型。
模型支持完备后,还要有各类开发工具,也要兼容MCP等当下最火的开放协议,以及数据管理的相关工具。把工程化能力,打包升级。
这个系统级方案,并不只是规划,而是已经在实践了。百度智能云在2024年发布了全球首个智能计算操作系统:万源,它包含了底层的GPU算力平台“百度百舸”和“千帆大模型平台”。在Create2025百度AI开发者大会上,这个系统,再次迎来升级。
在算力层面,百度正式点亮了昆仑芯P800的三万卡集群,昆仑芯超节点更是把64张加速卡放到同一个机柜,用更快的机内通信替代机间通信,可以把卡间互联带宽提升8倍,单机训练性能提升10倍,单卡推理性能提升13倍。
指数级的算力提升,还不够。百度智能云通过大规模分布式推理的PD分离,又实现了推理吞吐提升20倍,推理速度提升50%以上。为大模型全面应用,做足了准备。
刚刚在全球首个人形机器人半程马拉松中, “天工”机器人获得了冠军,而其背后的公司北京人形机器人创新中心,在训练和推理阶段,采用的算力资源正是百度百舸。
模型服务层面,千帆平台上提供了自研和第三方在内的,共计超过100多个模型,而且文心大模型也进行了升级发布:文心4.5 Turbo和文心X1 Turbo,X1的价格仅为DeepSeek-R1的25%,降本显著。
模型开发层,也是工具全面,并支持深度思考模型、多模态模型的定制、精调。模型蒸馏,也成为许多企业降低模型成本、提高性能的最佳选择之一。
在应用开发上,智能体Pro成为亮点,从快问快答升级到了深思熟虑,也支持每个企业定制开发。与此同时,百度智能云正式发布了企业级MCP服务,也已经有超过1000个MCP Servers供企业和开发者选择。
目前,千帆平台的企业用户数量超40万,千帆平台组件数量超1000个,企业在千帆平台上已开发出了超100万个应用。这只是开始,需求还远未被满足,未来应用会更多。
一个应用开发的背后,就是一个系统的打造。一个系统级的基础设施,描绘了无数应用的未来。
04展望
常言说,创新来自于千百次试错。但并不是每家企业都能扛住千百次试错,需要勇气、耐心、以及成本。
百度智能云构建的新一代系统级智能基础设施,并不是灵丹妙药,一定可以让开发者成功,但确实可以降低开发者的试错成本、提高试错意愿,也抚慰开发者的“焦虑”;它不仅是解决某一个问题,而是让企业拥有创造“创造的能力”。
全栈的便利,让开发者面对征途,不必东跑西找,也不会踌躅不前;而是敢于轻装上阵,没有心理包袱、没有技术包袱、没有财务包袱,寻找开发的路,推开应用的门,走进AI的精彩世界。
---全文完,欢迎交流
理工/金融 复合背景
畅销书《英伟达之道》译者
百亿私募/头部自媒体 双重经历
热门跟贴