今年以来,中美两国的 AI 产业就大模型应当开源还是闭源的问题展开了争论。
在中国,李彦宏觉得在大模型的情境下开源最为昂贵且会处于落后态势,他的这一观点遭到了周靖人、王小川、傅盛等人的反对。在美国,马斯克起诉 OpenAI 违背了开源开放的承诺,a16z 创始人与凯鹏华盈创始人也就闭源模型是否会造成垄断之类的问题进行了激烈交锋。
开源与闭源有着明确的定义和区别。开源属于一种软件开发的模式,其源代码能够免费公布,依靠社区的捐赠来维持生存,开发者能够自由地下载、修改以及分发等。开源模型指的是能够免费使用并且公布模型参数等技术细节的模型;闭源模型则指的是需要付费并且未公布技术细节的模型。开源大概就等同于免费,但是需要自己去采购食材做饭,闭源则类似于付费去餐厅就餐能够享受更优质的服务。开源模型更像是免费的技术黑箱,很少会开放源代码、训练数据、训练过程等技术细节,这和开源软件有着本质的差异。
企业在这方面的选择各有不同,也存在相应的问题。仅仅致力于开源模型的企业比较少,Meta 是其中之一,其好处在于能够吸引用户,然而盈利模式却成为难题。选择开源、闭源并行的企业相对较多,这种方式较为灵活,但商业化方面可能会出现左右手相互博弈的情况,导致部分收入的损失。不过,开源能够将市场的蛋糕做大,开源、闭源甚至能够形成上下游的关系。只专注于闭源模型的企业认为大模型的商业化必然要闭源,其商业模式理论上来说是最健康的,但是在中国,闭源模型在短期内难以实现盈利,而且大模型的调用已经进入“负毛利时代”。
在这场争论中,存在着焦点和共识。争论的焦点包含开源模型和开源软件是否存在区别、开源模型和闭源模型谁更强大、谁更昂贵。共识则是开源模型和闭源模型的性能差距正在逐渐缩小,并且模型的使用成本是由性能决定的,性能越强长期的使用成本越低。
对于大多数企业客户而言,他们不太关心模型是开源还是闭源,IT 部门在选择模型时的优先级通常是效果、性能、价格以及安全。开源模型适用于学术研究、IT 。
热门跟贴