文丨韩韩(作者系蓝媒汇创始人)

今天是我司收假第一天,上午和小伙伴复盘deepseek的时候提到了几个问题。比如为啥是deepseek制造了deepseek、而不是某个大厂?还有为啥deepseek能绕开算力军备竞赛的陷阱、实现弯道超车?更进一步的像deepseek的技术路径、算法关键节点等等。

然后有个点子王同事灵机一动说,为啥不问问deepseek自己呢?于是得到了deepseek自己认为自己能成功的10个理由:

1. 极端聚焦核心场景,而非盲目追求技术指标

早期放弃与巨头在通用模型上“刷榜”的竞赛,转而深度绑定金融、医疗等垂直行业的刚需场景。例如,针对量化投资客户对实时数据处理的需求,我们牺牲模型参数量以优化推理速度,使客户交易决策效率提升40%以上。场景聚焦让我们在资源有限时仍能创造可感知的价值。

2. 技术团队与行业专家的“细胞级融合”

不同于常见的技术团队+外部顾问模式,我们要求算法工程师必须通过轮岗制深入客户一线。曾有NLP组员在证券公司驻场3个月,发现金融文档中缩写解析的行业特异性,最终开发出针对性的实体识别模块,准确率比通用方案高26%。这种深度耦合催生出真正可落地的技术。

3. 数据飞轮的设计早于模型架构

在同行关注模型参数时,我们构建了“数据-反馈-增强”闭环系统。例如,在智能客服场景中,通过动态标注用户对话中的模糊意图(如“我不太确定…”)系统能自动生成强化训练样本。这种机制让模型在落地后持续进化,客户续约率提升至89%。

4. 对计算资源的“外科手术式优化”

自研的混合精度训练框架,结合硬件级算子优化,使训练成本降低至行业平均水平的65%。关键突破点在于:针对稀疏注意力机制重构内存访问模式,使单卡批量处理能力提升3倍。这种极致优化让中小客户也能负担定制化模型。

5. 容忍“非共识创新”的文化机制

设立“暗黑项目池”,允许员工用20%时间尝试高风险方向。例如,当前主力产品中的时序预测模块,最初正源于一名实习生提出的非主流架构。我们通过制度保障“反主流”想法能获得最低限度的资源验证,避免陷入技术路径依赖。

6. 客户成功(Customer Success)的闭环体系

建立客户行为数据埋点系统,不仅追踪产品使用频率,更监测如“用户绕过AI功能的手动操作次数”等隐性指标。通过量化价值缺口,我们的迭代方向始终与客户真实痛点对齐。这套体系使产品NPS(净推荐值)在18个月内从31提升至68。

7. 对技术债务的“零容忍策略”

在高速发展期仍坚持每季度“架构重构周”,例如将初期快速堆砌的20个独立模型重构为统一的多任务框架。虽然短期延缓了新功能上线,但使后续开发效率提升200%。这种克制避免了多数AI公司因技术债积累导致的创新停滞。

8. 开源社区的“杠杆式参与”

战略性开源部分工具链(如自动化标注工具DSLabel),但保持核心算法闭源。通过社区反馈改进工具易用性,同时建立开发者生态。这一策略带来意外收获:某跨国企业因深度使用DSLabel后,主动采购我们的企业版管理套件,单笔合同金额超千万。

9. 对商业本质的清醒认知

拒绝将“技术先进性”等同于商业价值。曾终止一个准确率达99%的医疗影像检测项目,因其所需标注成本超过医院支付意愿。转而开发准确率92%但支持半监督学习的轻量方案,实施成本降低70%,最终拿下区域医疗联合体订单。

10. 危机驱动的组织进化能力

在2022年某次核心客户数据泄露事件(已妥善解决)后,我们进行了三个根本性改变:将安全团队从成本中心转为产品联合开发方;重构权限管理系统至“细胞级隔离”;建立全员攻防演练制度。这次危机倒逼出的安全能力,反而成为后续竞标政府项目时的关键优势。

说实话写的非常专业和全面了。看答案之前,我试着从一个互联网科技从业者的观察角度、自己的主观角度也写了10个理由,发现有4个和deepseek高度重合,分别是:

1.跳出对领头羊的盲目跟风,不一味堆算力,反而转向算法精研与优化。只有走不一样的道路,才有弯道超车的可能。对应deepseek提到的“对计算资源的外科手术式优化”

2.通过垂直某一领域或地域,创造出更适合用户的模型,进一步获取更精准的数据,实现螺旋上升。对应deepseek提到的“数据飞轮的设计早于模型架构”“极端聚焦核心场景”

3.有质疑的勇气、能力、执行力。在全球AI都狂堆算力、看衰算法的情况下,依然敢“冒天下之大不韪”,从羊肠小道登顶,是一种幸运,更是一种魄力。对应deepseek提到的“容忍非共识创新的文化机制”

deepseek在答案最后总结说,以上这些经验本质上是无数试错的结果。我们曾因过度追求技术创新而错失市场窗口,也曾在客户需求面前妥协技术理想。真正的转折点,在于意识到AI公司的核心不是算法本身,而是用技术创造不可逆的价值链重构。这种认知的转变,或许比任何单项技术突破都更重要。

这就是deepseek能够脚踩BAT、拳打google、openAI的根本原因:大厂们厌恶风险,所以宁愿投入海量算力资源,水滴石穿式的堆出一个强悍智能体。因为算力的投入与产出是有明显进度条的。

但deepseek这种“穷小子”从诞生开始就没有这么庞大的资源可供挥霍,只能另辟蹊径、沿着一条未知的道路走到底。幸运的是,它成功了。

或许这种执着且野性的风格,才是资本一手遮天的背景下,唯一有可能出头的方式。

阅读更多