这几天deepseek在国内火了,在国内火的原因是它在美国火了,原因是它发布的人工智能大语言模型,接近甚至打败了美国各种科技大厂的大语言模型。美国人很惊讶,中国连高端芯片都没有,怎么就追上我们了?

现在美国人都夸我们厉害,所以国内各种赢麻了。我们现在的评价体系,依然是外国人赋予的。你在国内多厉害根本没用,国人不信。只有外国人说你牛,国内人才认你是真牛。屠呦呦就是最好的例子。

其实不是我们没有评价体系,而是我们的评价体系,被权力和利益绑架,国人根本不信任国内的评价体系。不过关于这个问题,不是我这篇作文要说的。我这篇小作文,主要还是要狠狠地夸,这家中文叫深度求索,英文叫deepseek的中国公司。

2022年12月,chatgpt横空出世。因为它是语言处理模型,每个人都能把它当聊天机器人使用。而多数人用了之后发现,认为这是革命性的变化。所以瞬间引爆了全世界对人工智能的热度,当时我们这也火了一下。不过因为某些人不让我们用chatgpt,怕我们的脑子走火入魔,所以舆论热度很快消退了。

舆论虽然消退了,可是国内明白人很多啊,他们都开始投身到,人工智能大语言模型的研究之中。得益于chatgpt的开源属性,国内的科技大厂们纷纷使用拿来主义,再套上自己的外壳,于是我们自己的大语言模型也纷纷出世了。

就在这个时候,以前的量化策略私募巨头,幻方量化基金公司。在2023年5月成立深度求索,也就是deepseek。创始人梁文锋本身就是计算机专业出身,使用的量化策略就是用人工智能炒股。所以他们不仅早就布局了供不应求的英伟达芯片,而且团队在人工智能的数学和算法方面,都有深厚且独特的积累。

2024年5月,deepseek-v2模型就出世了,而且使用价格是其他模型的几分之一甚至十几分之一。12月v3模型出世,就是我们现在用的。这个v3模型,在和美国各大厂的大语言模型的测评中,可谓是旗鼓相当,今年1月20日发布的R1模型,更是超越了OpenAI的o1模型。于是美国惊呼狼来了。

美国人惊讶的是,他们一向认为的创新沙漠,在高端芯片的被制裁的情况下,怎么突然在最重要的人工智能领域,就追赶上美国了?而且花费的金钱和时间,都远远低于他们自己的大公司。

这个原因呢,其实就两点。一是后发者优势,二是是算法创新。

后发者优势很简单,人家技术给你开源了,省下了前期的创新研发走弯路的艰苦阶段。我们站在前人的肩膀上,用时更短,花钱更少,这是很自然的事情。当然,这不是这个问题的关键。

问题的关键,也就是我要狠夸deepseek的地方,就是他们进行了算法创新。站在前人肩膀上的人很多,不过都是些跟随者而已。但是deepseek不仅跟随,而且在没有高端芯片的情况下实现了超越,这种超越,只有创新做得到。重要的事情再说一遍,只有创新才能超越,抄袭永远都是拾人牙慧,跟风吃屁。

地球人都知道,我们的土壤是盐碱地,正常的庄稼都要长歪,更别说创新了。我们中国人都是很清楚自己的,我们很聪明。只要有发挥的空间,我们就会成为世界的引领者。看看美国的硅谷有多少华人就知道了。

我们虽然是盐碱地,但是在一些前沿的领域,一些权力还没来得及控制的领域,我们还是有创新空间的。算法就是这样的领域,所以我们的聪明才智有了突破。

其实有创新,那只能说明我们中国人聪明,这个虽然值得骄傲。但真正让我骄傲的,是deepseek把自己创新的算法,进行了开源处理,让全世界都可以看到并使用。

梁文锋在采访中说,中国也要逐步成为贡献者,而不是一直搭便车。这话说的太对了,这才是我们中国人该有的气度,这个才叫真正的自信。

我们落后了几百年,近现代世界的进步,我们几乎没有贡献。现在2025年了,终于有人说出,我们也要做贡献者,而且他们做到了。

虽然这只是个算法的创新,不是什么革命性的贡献。但我希望这是个开始,我一直相信21世纪是中国的世纪,这就意味着我们会成为引领者和贡献者。

不说太远的事情了,还是说目前,我们的人工智能水平追上美国了吗?

现在的人工智能行业,发展非常快,竞争非常激烈。大家都在奔跑,都在创新。所以大家比的不是今天明天一时的领先,而是能不能一直的创新一直的领先。

人工智能说到底,就三个核心要素,数据,算法,算力。

1.算力,我们是落后很多的。我们既没有设计高端GPU芯片的公司,也没有制造高端芯片的工厂。在我们没有根本性改变之前,制裁肯定是逃不掉的。我们在算力上的差距,目前怎么看,都是要越来越大的。

国内居然有人认为,算法优化了,利空英伟达,这得多愚蠢啊。软件和硬件是互相支持,相辅相成的关系,不是零和博弈的竞争性关系。英伟达大家都看好,价格本身就高。来个假假的利空,稍微跌一点很正常。但不管这么看,长期是利好硬件芯片的。算法的优化创新,会促进人工智能的发展,反过来也会促进芯片的发展。

2.算法,我们并不落后。因为算法是很难保密的。就像做数学题,一种创新的解题方法,对于高手来说,一句话就够了。算法本身就很多开源的,即便是闭源的,搞算法的华人那么多,随便问问解题思路不是很正常么?甚至从这次deepseek例子看,我们的算法还是领先的,只不过这种领先,是不是能保持,还有待观察。

3.数据,这个就比较复杂了。如果是图形处理模型的数据,我们肯定是全球领先的。我们到处是摄像头,进个单元门都被采集走了数据。这种图形数据的数量,是美国开飞机都追不上的。所以我们的图形处理模型是很先进的,比如人脸识别,步态识别啥的。

但是说到大语言模型的数据,就绕不过去“中国特色”四个字了。我们的数据有很多缺失,甚至有很多错误,这都会影响到人工智能模型。何况我们的数据,长处在中文。可是中文的数据和英文数据相比,不论是数量还是质量,差距都太大。我们deepseek训练自己用的英文数据,很多都是通过chatgpt得出来的数据。

前几天用英文问deepseek它自己是个什么模型,它还说自己就是chatgpt4呢。这个也正常,就像谷歌的大语言模型,也会在中文问答的时候,说自己是百度的文心一言。不过这些问题都很快被修正了。中美双方都很缺乏对方的数据,都得抄袭对方大语言模型的数据,这就是数据的重要性。

这三个人工智能的核心要素,算力落后,算法不相上下,数据看分情况,目前就是这样的局面。

Deepseek我也用了用,的确是可以的。当然,可以的前提是,你不要问不该问的问题。