大陆AI新创企业DeepSeek(深度求索)近期推出“DeepSeek-V3”与“DeepSeek-R1”两款最新的AI模型。这两款模型具备低廉的制造成本,且采用运算能力相对低阶的辉达H800晶片,却拥有与全球顶尖AI语言模型匹敌的表现(例如OpenAI 的 ChatGPT-4),撼动美国矽谷科技界,迅速在美国走红,27日更一举超越ChatGPT登上美国区苹果App Store免费榜上首位。

对此,中国工程院院士、清华大学教授郑纬民点出了DeepSeek成功主要有3个核心因素:首先技术层面方面,DeepSeek核心自主研制的DeepSeek-V3和DeepSeek-R1 两个模型,其效能与OpenAI的4o和o1模型相当。其次成本低廉方面, DeepSeek研发出的这两个模型成本仅为OpenAI 4o和o1模型的十分之一左右。最后在开源模型方面,DeepSeek将这两个强大的模型技术开源,让广大的AI团队可以利用这些最先进且成本最低的模型,开发更多具有创新性的AI应用程式。

被问到DeepSeek如何实现模型成本降低,郑纬民指出,DeepSeek自主研发的MLA(Memory-Limited Attention)架构和 DeepSeek MoE(Mixture of Experts)架构,对于降低其模型训练成本发挥了关键作用。

国民党“立委”蔡正元在脸书发文表示,中国晶片还输美国,但美国没料到中国在AI模型朝车,把ChatGPT挤到老二,连带拉AMD和华为,让辉达无法唯我独尊。他今天将DeepSeek比喻为超级黑天鹅,重挫美股。

蔡正元表示,周一美国股市大震撼盘前交易股价,辉达和台积电股价下杀10%以上,美国科技股像遭到大地震袭击,大杀盘的原因只有一个,美国几家专业及学术机构认证、最新出炉的AI模型“深寻”或“深度求索”,DeepSeek与OpenAI的ChatGPT较量,有过之而无不及OpenAI的ChatGPT,要使用大量昂贵的辉达AI晶片要用台积电的高端制程,要花费钜资盖豪华的算力中心,还要耗尽庞大的电力。

蔡正元说,更令人讶异的是,DeepSeek都不需要,不需要昂贵的辉达AI晶片,所以辉达股价下挫;也不需要台积电的高端制程,所以台积电股价下杀。原本ChatGPT开创出来的演算法已经走在AI前沿,打败Google和Amazon的AI演算法,带着辉达和台积电风光了两年,没想到DeepSeek横空出世,开创出来另一条AI模型新捷径,目前被认定可能会像抖音把YouTube挤到老二那样子,DeepSeek把ChatGPT挤到老二,连带拉AMD和华为,让辉达无法唯我独尊。

蔡正元说,更让拜登和雷蒙多要遏止中国AI的念头成了一场白日梦,DeepSeek的设计者是一群北京大学和清华大学的博士,这下子有好戏看了。中美竞争刚开始,美国认为不卖辉达晶片给中国,中国的AI就没搞头,虽然中国晶片目前还输美国,美国没料到中国却在AI模型硬超车,看看美国还有什么法宝可以遏制中国的AI?

蔡正元今天亦表示,中国科技已经开始寒武纪大爆发,自1977年开始,经过一代人的努力栽种,又一代人辛勤耕耘,到了2025年共计近48年。

蔡正元说,原本在世界大学排行榜上没有名次的中国各大学,现在纷纷跃升世界前茅,产生出来的人才一代比一代优秀,自然而然中国科技不论在太空、陆地、海洋、网络,不断爆发震撼性的突破。横空出世的黑科技令人目不暇给,DeepSeek的出现,宛如一只超级黑天鹅,直接让美国股市重挫,威力之大令人不可思议 。