估计大家都不信,23-24这两年,前后涌现出来的各种国产大模型的数量起码有200多个,包括耳熟能详的文心一言,通义千问,Kimi,更多的你还没听过就基本上无了。
如果你感兴趣,可以看看这个Github仓库,名叫「中国大模型列表 Awesome LLMs In China」,列出了绝大多数的国产大模型,数量一度达到了245个,时间跨度也近乎两年。
比如你看这是比较新的几个,一个也没听说过。
最前面的几个倒是大多数都听过且用过,比如百度的文心一言,智谱AI的ChatGLM系列,阿里云的Qwen全家桶等等。
其实迄今为止,能叫得上名字的国产大模型,基本上都有自己的绝活,毕竟这种实用型技术,不开放使用或者开放使用但是性能很差的话,那就几乎留不住用户,基本上活不过一周就没了。
排除掉一直不开放使用的,以及开放使用后发现性能拉垮的,再把一些虽然没开放使用但是名气不小的整理下,能进行排名的国产大模型其实不多,我们先列出来。
公司
大模型
链接
文心一言
https://yiyan.baidu.com/
智谱
GLM
https://www.zhipuai.cn/
百川智能
https://www.baichuan-ai.com/home
通义千问
https://tongyi.aliyun.com/
上海人工智能实验室
书生
https://intern-ai.org.cn/home
深度求索
Deepseek
https://www.deepseek.com/
科大讯飞
星火
https://xinghuo.xfyun.cn/
字节跳动
豆包,即梦
https://www.doubao.com/chat/
商汤科技
商量
https://www.sensetime.com/cn
月之暗面
Kimi
https://kimi.moonshot.cn/
可灵
https://klingai.kuaishou.com/
华为
盘古
https://www.huaweicloud.com/product/pangu.html
复旦大学
MOSS
https://github.com/OpenMOSS/MOSS
面壁智能
CPM
https://modelbest.cn/
腾讯
混元
https://hunyuan.tencent.com/
零一万物
Yi
https://www.lingyiwanwu.com/
基本上就是这些公司以及对应的大模型,有些模型其实现在已经没有声响了,比如复旦的MOSS大模型,商汤的商量大模型等等,都是短时间内名噪一时,然后就没有然后了。
到现在为止还在活跃的,其实总体上满足两个特性:
第一是本身底蕴强,比如互联网大厂,AI技术的积累非常深厚,这里面的代表就有阿里云和百度。
第二是技术独创性,比如Kimi大模型的超长上下文特性,以及Deepseek优化后的超低推理成本等等。
除了这两个之外的科研机构做出来的大模型,基本上都逃不过后续再训练需要的巨额成本。
所以排名的范围就进一步缩小了。
以下的排名将分为五个子榜,分别从大模型智能水平、产品丰富度、AI视频子分类、AI搜索、ChatGPT差距大小以及产品潜力。
大模型智能水平
这个衡量的就是大模型够不够聪明,简单来说就是能不能听懂提示词以及正确的执行。
我们就按中国大模型排行榜这个github库的资料为参考,并且用国外GPT4系列、Llama以及Gemini作为参考,可以看到零一万物和百度以及Qwen是排在前三的。
这个维度的比较很难,因为单纯从智能角度,这个世界上毫无疑问GPT是第一,但是第二其实是一组,根据我平时的使用习惯,我觉得以下几个AI大模型智能程度不分先后。
·阿里云-Qwen
·月之暗面-Kimi
·智谱-GLM4
·深度求索-Deepseek
·字节跳动-豆包
这个维度是会经常更新的,所以也非常考验公司的研发力度,这里面就涉及到了资金和人才积累,这几个要么是都是豪门,产品也发的快,智能程度总体上不相上下,我觉得中肯。
产品丰富度
AI大模型其实有非常多的衍生产品,比如对话机器人,AI绘画,AI视频,AI音乐等等。
像阿里云就比较全面,几乎所有方向都有涉猎,而相反的公司比如说快手,就专攻AI视频。
而产品丰富度其实反映了开发与盈利能力。
这个维度上,我觉得按公司比较好:
1 阿里云,字节跳动,百度
阿里云有全系列的开源大模型Qwen,还有AI视频,AI绘画,AI辅助编程等等,基本上涵盖了所有的方面。
另外也有绝活大模型服务平台百炼这样的产品,非常适合做大模型应用。
字节也是财大气粗,基本上涵盖了绝大多数方向,且豆包模型在大多数平台都可以流畅运行,很好用。百度AI豪门,自然也几乎是全家桶,并且它还有一手自动驾驶的绝活。
2 月之暗面
Kimi一度非常的火,最开始出来的时候智能水平都快赶得上最新的GPT4模型,后来发的产品也不少,比如Kimi联网搜索。Kimi的产品经理大概率是很好玩的年轻人,推出的很多功能都非常的适配年轻人的需求。
AI视频子分类
这个单独列出来,是因为AI视频其实是一个很难做的项目,幻觉问题比文本大模型严重的多,且比较难盈利,基本上能活下来的都是背靠大厂。
这里我觉得国内有两个很牛的产品。
一个是背靠字节跳动的即梦。
另一个是快手的可灵。
放在全世界内也是能打的,可以说这俩很难分出个胜负,基本上各有所长,且更新进度很快,特别是提示词遵循以及动态效果都已经做到了很好的效果。
AI搜索
这是个比较小众的领域,有些产品是大模型附带的,比如Kimi的搜索功能,但也有一些就是纯粹的AI搜索产品,比如秘塔AI。
这个子领域我觉得比较好用的有:
·秘塔AI:比较全面,另外出的比较早
·知乎直答:独特的AI搜索产品,大部分为知乎回答
·Kimi搜索
·豆包
后两个其实是AI大模型公司的衍生产品,不算主打产品,所以用哪个其实很看自己的使用习惯。
ChatGPT差距
这个比较的是追最新技术的能力,比如OpenAI最新的o系列主打Reasoning,其实可以反映出这个领域的最新进展。
而o1其实提出了一段时间了,但国内有能力且真正复现的公司只有两个:
1 深度求索-Deepseek
直接开放使用深度思考能力,每天都有免费字数,复现表现非常的好。
2 阿里云-QwQ
这个是直接开源的,属实是难能可贵。
https://huggingface.co/Qwen/QwQ-32B-Preview
产品潜力
其实AI大模型到现在,就只有OpenAI与其他公司,而其他的公司之间有差距,但都是肉眼可见的。但AI发展肯定是一个长期追逐战,能够有这个潜力的,基本上还得满足之前提到的条件。
a.资金充足
b.人才储备
c.技术壁垒
1 阿里云和字节
这俩无疑资金没问题,人才储备也能从丰富的产品线和频繁的更新上可见一斑,最后技术壁垒大家面临的差不多,阿里云相比字节率先实现了reasoning,但是差距不会很大。
2 百度
老牌豪门,只要技术路线清晰,没道理不会回到一线。
3 腾讯
AI并不是主打,但是架不住有钱任性。
其他的公司我认为融资危机是存在的,从稳妥角度上没有加入排名。
热门跟贴