4月2日讯,APUS与新旦智能联合训练、研发的千亿MoE(Mixture of Experts)架构大模型,在GitHub上正式开源。该模型在4090之类低端算力芯片上,综合性能达到GPT-4的90%。据钛媒体App了解,APUS-xDAN大模型4.0特点是多专家模型组合,实际运行效率对比传统Dense同尺寸模型效率提升200%,推理成本下降400%。在实际部署上,模型尺寸缩小500%,是国内首个可在消费级显卡运行的千亿MoE中英文大模型。
分享
热搜
相关推荐
-
全世界机器人共用一个大脑,谷歌DeepMind已经完成了第一步
机器之心Pro -
「还是谷歌好」,离职创业一年,我才发现训练大模型有这么多坑
机器之心Pro -
大疆前高管带6人创业,做出了类目Top1的割草机器人
钛媒体APP 93跟贴 -
Deepfake假CFO骗走公司1.8个亿,员工:视频会议每个人都很真实啊
量子位 -
一哄而上,打不赢美国高科技
华商韬略 4777跟贴 -
论文 Figure 不堪入目,句子啰嗦读不通……这几个在线科研工具可以免费用了
生物学霸 -
中国科技巨头员工赴韩,被提前设局批捕,背后三个疑点,令人深思
向知平说 12跟贴 -
面对英伟达的挑战,中国的国产算力地图正在形成
宁南山 233跟贴 -
白宫顾问:为什么美国制裁拦不住中国芯片崛起?
底浪Wave 81跟贴 -
这是几纳米芯片功能这么强大
打夏爱追剧 -
“中国芯片之父”张汝京,为回大陆造芯片,被开除台湾省户籍
口说名人堂 -
OpenAI 6个月赚34亿美元!年化收入直接翻倍,却遭CTO揭底:ChatGPT与免费模型差距不大
新智元 3跟贴 -
刘亚东:芯片比载人航天难10倍,弯道超车也行不通
钛媒体APP -
贵州年人均纯收入低于万元的人口已基本动态清零
新京报 8.2万跟贴 -
!计算能效超现有芯片2—3个数量级
每日经济新闻 10跟贴 -
大模型到底有没有智能
卢菁老师 -
全球最大神经拟态系统来了,比人脑快20000%,内置1152个7nm Loihi2芯片
钛媒体APP -
RAG是如何解决大模型的三大问题
卢菁老师 -
不会出口欧美!拜登做梦也没想到,中国出手会这么狠
科技龙 12跟贴 -
尺寸确实大!试驾东风奕派eπ008
闫闯说车
热门跟贴