2023年有人预言SaaS泡沫将破,理由是AI能让个人开发者以极低成本复制商业软件。当时没人信。现在Malus.sh出现了——一个能把GPL代码"洗"成MIT的AI服务,名字在拉丁语里意思是"邪恶"。
这不是概念验证,是已经跑通的商业模式。
更狠的是第二招:针对SaaS的"清洁室攻击"连源代码都不需要。你暴露的每一个API响应、每一次按钮交互、每一条错误提示,都是AI的饲料。喂进去,吐出来一份功能规格书,再喂给另一套AI实现。原代码从未被"看见",版权主张无从谈起。
软件行业用了40年建立的知识产权护城河,正在变成漏水的筛子。
1982年的判例,成了2025年的武器
故事要从IBM PC时代讲起。1982年,Phoenix Technologies想造兼容机,但IBM的BIOS受版权保护。他们的解法堪称天才:A团队拆解原版BIOS,写出纯文字的功能规格;B团队从未接触原版代码,只凭这份规格从头实现。
法院判了:合法。B团队是独立创作,没有复制行为。这个"清洁室"流程从此成为法律先例。
43年后,这套流程被AI自动化了。2025年3月,Malus.sh在FOSDEM(欧洲最大开源会议)上亮相,演示简单粗暴:上传你的依赖清单,AI系统替你重写所有开源库,许可证随你挑。GPL变MIT,AGPL变私有,价格按代码量计。
现场有人当场用Claude实操,把Python的chardet库从LGPL"迁移"到MIT。开源社区炸了,Hacker News讨论帖冲到1400多条评论。
争议焦点很尖锐:这到底是copyleft的末日,还是一场精心设计的思想实验?
创始人的说法是警告——"看,你们的安全机制有多脆弱"。但技术一旦公开,用途就不由发明者说了算。就像核裂变最初是能源方案,后来成了炸弹。
为什么SaaS比开源更危险
大多数人的注意力在开源许可证上,但真正的猎场在SaaS。
开源软件至少还有源代码可查,SaaS只暴露行为。用户看到的只有界面和API,底层实现是黑箱。这曾是SaaS的护城河——竞争对手看不到你怎么做的,只能猜。
AI把这个优势变成了弱点。
行为比代码更容易采集。每次点击、每个响应延迟、每种错误码格式,都是可观测的信号。攒够样本喂给大模型,它能推断出内部逻辑结构。不需要看到源代码,只需要看到足够多输入输出对。
更麻烦的是法律层面的不对称。
开源作者可以主张"你的AI训练用了我的代码",但SaaS厂商连这个抓手都没有。清洁室辩护在这里更强:整个重建过程从未接触任何受版权保护的材料,只有公开可观测的行为数据。
有人反驳:LLM训练时明明"见过"那些代码,Claude能完整复述chardet源码包括许可证头。这是污染证据。
技术上可以规避。双LLM架构:模型A读原始代码写规格,模型B只读规格写实现,两者权重不共享。或者三LLM、四LLM,每多一层溯源难度指数级上升。混用不同基座模型、不同云服务商、不同司法管辖区,法庭上要证明"最终输出源自某段特定训练数据",几乎不可能。
版权法的根基是"接触+实质性相似",AI清洁室把"接触"这个要件彻底架空了。
商业软件的定价权正在瓦解
这对SaaS经济模型的冲击是结构性的。
传统SaaS的高毛利建立在复制成本为零、研发成本摊薄的基础上。一个团队写代码,百万客户分摊费用,边际成本趋近于零。这是软件行业的印钞机模式。
AI复制把这个等式打破了。
复制成本依然趋近于零,但研发成本也在崩溃。不需要雇佣工程师理解业务逻辑、设计架构、写测试,只需要一个会操作AI工具的人,加上足够的算力和观测数据。
不是"降低研发成本",是"重新定义什么是研发"。
2023年那篇预言文章算错了时间线,但方向没错。当时以为需要3-5年,实际只用了18个月。技术迭代的速度超过了商业预期的调整速度。
具体会怎么死?三种路径已经清晰:
第一种,工具类SaaS。功能单一、接口标准、行为可预测,最适合AI逆向。日历、记账、表单、简单的CRM,这些产品的差异化本来就在界面和运营,核心逻辑被复制只是时间问题。
第二种,垂直行业软件。数据壁垒曾是护城河,但RAG(检索增强生成)和微调技术让行业知识变得可迁移。只要你有客户愿意配合做数据标注,竞争对手可以用AI快速逼近。
第三种,平台型产品。最讽刺的是这里。平台的价值在生态和网络效应,但API本身就是行为数据的富矿。用你的人越多,暴露的接口行为越多,被AI重建的素材越丰富。
不是"所有SaaS都会死",是"所有依赖代码保密作为核心壁垒的SaaS都会死"。
存活下来的会是什么形态?可能是重运营、重服务、重线下履约的混合模式。代码不值钱了,但"知道怎么用代码解决具体问题"还值钱。不是卖软件,是卖软件+人的组合。
开源社区的两难
Malus.sh事件把开源运动逼进了墙角。
copyleft许可证的设计初衷是防止"寄生"——你用了我的代码改进,就得把改进共享回来。GPL的"传染性"条款让商业公司头疼了几十年,但也确实保护了开源生态的可持续性。
AI清洁室让这套机制失效了。不是绕过,是合法地、技术地、不可追踪地消解。
开源作者的反应分成两派。一派主张技术对抗:用更激进的许可证,比如SSPL(服务器端公共许可证),要求托管服务也开源。但SSPL本身就有争议,被OSI(开源倡议组织)认定不符合开源定义,主流云厂商直接抵制。
另一派转向法律战。欧盟AI法案、美国版权局的AI生成物登记政策,都是潜在的战场。但法律滞后于技术,等判决下来,商业模式已经跑通。
最务实的声音来自一线维护者:接受现实,改变变现逻辑。不是卖代码许可,是卖签名认证、安全审计、优先支持。代码变成流量入口,服务才是收入。
这和SaaS的转型方向意外一致:软件本身 commoditized(商品化),围绕软件的服务增值。
一个行业共识正在形成:源代码的稀缺性时代结束了。
1982年Phoenix Technologies的判例确立时,没人想到它会被用来对抗开源运动。法律原则的稳定性,在技术迭代面前变成了双刃剑。你保护的是创作自由,但自由也可以被用来消灭自由。
Malus.sh的命名是个黑色幽默。拉丁语malus同时有"邪恶"和"苹果树"的意思——知识之树的果实,吃下去就再回不去。
开源社区现在面对的就是这个选择:吞下苦果,接受代码作为公共品的现实;或者继续守着旧世界的规则,看着规则被架空。
没有第三种选项。
当AI能把任何软件的行为转化为可执行的规格书,当多跳LLM系统让溯源成为不可能的任务,版权法在软件领域的适用性本身就成了问题。不是"如何执行",是"执行什么"。
2025年的开发者面对的世界,和1982年、2005年、2020年都完全不同。源代码曾经是资产,现在是基础设施;曾经是壁垒,现在是入口;曾经是权力的来源,现在权力转移到了那些掌握AI工具、数据管道和客户关系的人手里。
SaaS不会明天就死,但"高毛利软件订阅"这个商业模式的根基已经松动。投资者开始问:如果竞争对手能用AI在三个月内复制你的产品,你的估值倍数应该怎么算?
这个问题没有标准答案。有人押注网络效应,有人押注数据飞轮,有人干脆转型做AI基础设施。唯一确定的是,继续假装什么都没发生,是最差的选择。
Malus.sh的演示代码还在GitHub上挂着,FOSDEM的演讲视频播放量过了十万。嘲讽它的人和支持它的人在同一个帖子里争吵,但两边都承认一件事:技术已经准备好了,剩下的只是法律和社会怎么反应。
那个用Claude重写chardet的人后来删了仓库,但fork记录还在。技术不会消失,只会扩散。
当你的竞争对手开始用AI清洁室复制行业头部产品的功能,你是跟进,还是起诉,还是重新思考自己到底在卖什么?
热门跟贴