对于关注国产硬件的科技发烧友来说,龙芯中科在2023年11月28号的“到中流击水——2023龙芯产品发布暨用户大会”是近期的一个焦点话题。在本次发布会上,龙芯中科公布了最新的龙芯3A6000处理器,为我国芯片设计制造领域注入一针强心剂的同时,也证明我国桌面CPU自主研发设计踏上了新的台阶。

不过,从产品实用价值与体验来说,如今的龙芯能否满足用户的办公、娱乐等需求呢?为此,《微型计算机》评测室特地借测了一台搭载龙芯3A6000的国产整机。实践出真知,我们一起来看看。

龙架构(LoongArch)横空出世

在实机测试之前,让我们先来回顾下龙芯的发展历程。2001年5月,在中科院计算机所的支持下,龙芯课题组正式成立。仅一年多时间,首块龙芯1号芯片X1A50流片成功。自此龙芯走上了不断发展创新的道路。龙芯1号于2002年研发完成,当时使用的是MIPS Ⅲ指令集,具有七级流水线、32位整数单元和64位浮点单元。

龙芯2号在2003年正式完成并发布,这颗64位处理器的主频为300MHz至1000MHz,最初使用的是0.13微米工艺,后续的芯片生产工艺进行了精进。实际上龙芯2号是一个系列产品,包括2、2A、2B、2C、2E、2F等型号。

2009年龙芯3号诞生,该系列包含了3A、3B等产品。龙芯3A是我国第一个具有完全自主知识产权的四核CPU,采用65nm工 艺,主频为1GHz,晶体管数目达4.25亿个,单颗龙芯3A的最大功耗为15W,理论峰值为16GFLOPS,每颗CPU单瓦特能效比为1.06GFLOPS/W,是x86 CPU的两倍以上。龙芯3A的指令系统 不再是单一的MIPS指令集,而是MIPS64兼容并通过指令扩展支持x86二进制翻译。龙芯3B也是一款重量级产品,由中国科学技术大学和深圳大学联合研制而成的万亿次高性能计算机KD-90, 就采用了自主设计的龙芯3B八核处理器。搭载了10颗八核龙芯3B处理器的KD-90计算机理论峰值计算能力达到每秒1万亿次。

2001年到2019年,龙芯处理器采用MIPS架构,且在后续开发中使用指令扩展优化对x86指令集的翻译。在此期间,龙芯的自研道路从未停歇。2020年,历经20年的研发和生态建设,龙架构(LoongArch)横空出世。

龙架构(LoongArch)是一个高性能低功耗的芯片架构,具有较好的自主性、先进性和兼容性。包括基础架构部分,以及向量指令、虚拟化、二进制翻译等扩展部分,囊括近2000条指令。

龙芯架构具有RISC指令架构的典型特征。指令长度固定且编码格式规整,绝大多数指令只有两个源操作数和一个目的操作数,采用load/store架构仅load/store访存指令可以访问内存,其它指令的操作对象均是处理器核内部的寄存器或指令码中的立即数。

龙芯架构分为32位(LA32架构)和64位(LA64架构)两个版本,LA64架构应用级向下二进制兼容LA32架构。那何为应用级向下二进制兼容呢?应用级是指:这种向下二进制兼容只在应 用层面生效,并不能保证系统软件(如操作系统内核)的二进制,在兼容LA64的架构上获取相同运行效果。向下二进制兼容是指:采用LA32架构应用软件的二进制,可以直接运行在兼容LA64架构的机器上,并且运行效果相同。

龙芯架构采用“基础+扩展”的组织形式。基础部分包含非特权指令和特权指令两部分,非特权指令处定义采用了常用的整数和浮点数指令。扩展部分包括二进制翻译扩展、虚拟化扩展、向量扩展、高级向量扩展四个部分。二进制扩展用于提升跨指令系统二进制翻译在龙芯平台的执行效率;向量扩展和高级向量扩展采用SIMD指令来加速计算密集的应用;虚拟化扩展用于为操作系统虚拟化提供硬件加速以提升性能。龙芯架构的基础部分和扩展部分为龙芯芯片的兼容性与扩展性提供了可靠有力的技术支持。

在数据安全方面,龙芯内置安全模块安全SE(Security Element)。它将密码计算技术和通用计算技术进行芯片级一体化融合设计,让芯片具有硬件级别的密码算法处理能力和芯片级安全防护能力。处理器内核内嵌安全SE核生成安全SE密码块,密码随机产生,支持SM2、SM3、SM4等加密算法;并且实现了数据加解密、身份鉴别、数字签名、数字信封等,真正保障数据的保密与安全,可广泛用于金融、能源、交通等单位业务办公系统。

龙芯架构的四个扩展槽和基础指令集。

龙芯3A5000是首款支持LoongArch架构的龙芯芯片,也是3A6000的前代产品。它首次实现了从指令集、微架构到芯片设计的完全自研。在与龙芯3A4000处理器保持引脚兼容的基础上,频率提升至2.5GHz,性能提升50%以上,且功耗降低至少30%。它使用成熟工艺制造,支持128位/256位向量指令;四发射乱序执行;拥有4个定点单元、2个向量单元和2个访存单元,和2个DDR4控制器;典型功耗在35W@2.5GHz。

而龙芯3A6000是龙芯第四代微架构的首款产品,采用成熟制造工艺,其最高主频仍然保持在2.5GHz,集成4个最新研发的高性能6发射64位LA664处理器核,支持128位向量处理扩展指令(LSX)和256位高级向量处理扩展指令(LASX)。架构指令集的提升,使得龙芯3A6000较龙芯3A5000单核性能提升了60%以上,并且龙芯3A6000首次支持同步多线程,实现四核八线程,多核性能提升100%。

搭载龙芯3A6000的国产整机——办公、娱乐全胜任

本次我们收到的搭载龙芯3A6000处理器的整机,采用ATX规格的爱国者C3商务机箱,整体较为轻便,能轻松搬运和拆卸。当然我们最感兴趣的还是它的内部。它与传统PC没有明显区别,处理器采用风冷散热,龙芯3A6000芯片以BGA封装的形式直接焊接在主板上。该机搭载了铭影RX580 8G显卡,可支持最大3840×2160的分辨率,能够在1080p分辨率下,流畅运行大部分游戏。存储部分配备了由两根力存DDR4 3200 8GB内存组成的双通道16GB内存系统,以及大华C900 256GB SSD。电源则来 自爱国者的ES650,额定功率可达650W,足够满足核心配置的使用需求。

产品规格

处理器:龙芯3A6000

显卡:铭影RX580 8G

内存:力存 DDR4 3200 8GB内存×2

硬盘:大华C900 256GB SSD

尺寸:385mm×175mm×410mm

硬盘位:HDD×2 SSD×3

面板接口:USB3.0×1、USB2.0×1、音频接口

机箱背面,具有电源接口、鼠标键盘接口、显示器接口等等。

机箱正面细节,设有一个USB3.0和两个USB2.0接口,以及音频接口。

系统内部配备力存DDR4 3200 8GB内存×2、大华C900 256GB SSD、铭影RX 580 8GB显卡。

龙芯3A6000处理器采用BGA封装,直接焊接在主板上,最高频率在2.5GHz。

根据龙芯官方所出示的数据并综合相关测试结果,龙芯3A6000处理器总体性能与Intel公司2020年上市的第10代酷睿四核处理器相当。值得注意的是,同为四核八线程,龙芯3A6000的最高主频率为2.5GHz,第十代酷睿i3的最高睿频频率为4.30GHz。也就是说,官方资料显示,龙芯可以与其打得有来有回,低频战高频却不落下风!

对标Intel第10代酷睿i3?那就战一战(全默认测试)

我们选择了三项测试分别是SPEC_CPU_2006、Stream和UnixBench,对其性能、内存和日常处理事务能力进行综合测试。

处理器基准性能测试:SPEC_CPU_2006

龙芯曾公开过此项目的跑分,该跑分由工信部旗下赛西实验室测试得出,单核整数和多核整数成绩分别是43.1和155,单核浮点和多核浮点成绩是54.6和140。我们实际测得的数据则是单核整数和多核整数成绩分别是42.4和151,单核浮点和多核浮点成绩是54.4和143。这与龙芯宣传的数据基本一致。第10代酷睿i3-10100F这边,单核和多核整数成绩得分为44.9和145,单核和多核浮点成绩达到56.1和150。龙芯3A6000在多核整数这一项上取胜,其他项目对比i3-10100F稍有落后。

处理器性能基准测试:UnixBench

UnixBench主要是测试一台电脑处理日常事务的效率,包括文本处理、浮点函数、文件读写、进程创建、管道通信、脚本执行等等。也就是说UnixBench并非只是单纯的CPU测试,而是测试系统的整机综合性能。这项测试中,龙芯3A6000的单核成绩为2117.7,多核成绩为8982.4,而第10代酷睿i3-10100F的单核成绩为2701,多核成绩为9813。第10代酷睿i3-10100F取得一定优势,不过至少龙芯3A6000的性能水平差别不大,已经非常接近第10代酷睿i3-10100F。

龙芯UnixBench报告原图,单线程分数为2117.7,八线程分数为8982.4。

在此项目测试中,酷睿i3-10100F的分数略高于龙芯3A6000。

Stream内存性能测试:龙芯3A6000全面领先

最后是Stream测试。Stream测试是一个简单的综合基准测试程序,它测量可持续的内存带宽(MB/s)。Stream对于CPU的计算能力要求很小,对CPU内存带宽压力很大。测试内容主要是使用四种数组运算,数组的复制(Copy)、数组的尺度变换(Scale)、数组的矢量求和(Add)、数组的复合适量求和(Triad)测试内存带宽性能。

三颗芯片Stream的单线程、四线程、八线程测试成绩。

在Stream内存测试中,我们使用的是DDR4 3200内存,但第10代酷睿i3-10100F最高只能运行在DDR4 2666规格上,其内存规格与龙芯3A6000相比有一定差距。

同频2.5GHz对比测试

单核性能可与酷睿14代匹敌!

在上述测试过程中相信大家也发现龙芯3A6000最高主频率为2.5GHz,而酷睿i3-10100F最高主频可达4.30GHz。那么在相同频率、相同核心数量、相同线程数量的情况下,龙芯3A6000和酷睿处理器的战况对比会如何呢?

我们将酷睿i3-10100F进行了降频处理,把处理器主频也限制在2.5GHz,并且还选取了最新的酷睿14代旗舰处理器—酷睿i9-14900K进行了对比。我们关闭了它的所有E Core能效核、仅保留四颗P Core性能核、采用四核心、八线程配置,在2.5GHz 频率下参与了测试。

接下来就让我们看看在相同的起跑线上,龙芯3A6000与第十代酷睿处理器、最新的酷睿十四代处理器的对比情况。

SPEC2006的测试显示,在相同频率下龙芯3A6000无论是单核还是多核性能分数都高于酷睿i3-10100F,甚至于在单核分数上与酷睿i9-14900K也有一战之力。

而在基准测试UnixBench测试中,龙芯3A6000可以称得上“独占鳌头”。单核性能超过酷睿i3-10100F约22.65%,领先酷睿i9-14900K约1.36%。

龙芯3A6000的多核性能表现尤为强悍,较酷睿i3-10100F和酷睿i9-14900K性能高出了32.69%和16.66%。无论单核还是多核,酷睿i3-10100F和酷睿i9-14900K都未能在同频率下的性能基准测试中战胜龙芯3A6000。

数值证明水平,使用体现价值

测试数据的高低也许只能体现CPU在测试软件环境下的理论性能水平,在实际使用中的表现才能体现CPU真正的价值。那么在游戏、办公、软件生态这几方面,龙芯3A6000的实际表现又是什么样的呢?

我们知道,龙芯3A6000使用自研的LoongArch指令集架构,那么这就带来一个问题——不同指令集架构的应用软件无法兼容,而针对LoongArch架构进行开发的应用软件又只有国内一线大厂,所以生态成了新架构应用前景的关键。

龙芯给出的解决方案是利用二进制翻译模块对基于其他指令集架构的程序进行转译,使得软件的兼容性大大改善,并且融合了国际主流指令系统的主要功能特性。依托龙芯团队在二进制翻译方面十余年的技术积累创新,已经能够实现对多种国际主流指令系统的高效二进制翻译。

我们打开龙芯3A6000样机自带的软件商店,里面包含了用户常见、常用的软件。龙芯自己搭建的龙芯应用合作社,也持续不断地在上新软件,进入官网可以搜索到满足各种需要的软件,点击安装,等待片刻就可使用,免去了上网四处搜寻安装包的烦恼。

龙芯应用合作社

办公软件的使用情况,我们测试了WPS的图文打开时间,在11.8.2.10296版本的WPS下,50MB DOC文件的打开时间为1.62s,50MB的PPT(文本+图片)最快打开速度为0.88s。即使面对20MB容量100万字的Word文件,无论是打开速度,还是缩放到一定比例下的多页预览,龙芯3A6000都显得游刃有余。而打开文件大小为50M的PPT和Excel也不在话下,并且龙芯也适配了《QQ》《微信》《钉钉》《腾讯会议》等日常办公聊天软件。

使用龙芯3A6000打开50MB DOC文件的时间为1.62s

我们还测试了VScode、PyCharm这类编程软件,可以轻松安装不同的插件,无论是前端页面还是后端框架都满足开发需求,有需要的朋友可以在官方的应用商店中选择自己熟悉的开发软件,安装并使用。在龙芯官方网站也有龙芯开源社区对各类编程库(如npm仓库、Maven仓库等)进行设配,并且龙架构已得到国际开源软件界广泛认可与支持,正成为与x86/ARM并列的顶层开源生态系统。

目前龙芯已向GNU组织申请到ELF Machine编号(258号),并获得Linux、Binutils、GDB、.NET、GCC、LLVM、Go、Chromium/V8、Mozilla/SpiderMonkey、FFmpeg、libyuv、libvpx、OpenH264、SRS等音视频类软件社区、UEFI(UEFI规范、ACPI规范)以及国内龙蜥开源社区、欧拉openEuler开源社区的支持。

PyCharm在搭载龙芯3A6000的整机上试运行。

龙芯官方开源社区

除了日常办公,大家也可以将龙芯3A6000用来休闲娱乐。B站的弹幕文化是特色之一,弹幕的在较多的情况下对CPU的负载也是有压力的,在经典的高级弹幕测试中,面对数量如此庞大的高级弹幕,处理器占用率飙升,不过弹幕还在正常运作,视频仍然“不为所动”,正常播放。除了高级弹幕测试还有高分辨率的视频播放,当选择的B站视频分辨率来到4K,处理器占用率通常处于30%~60%之间,峰值为77%,在此情况下流畅播放不成问题,但是弹幕一多,会出现掉帧的情况。

高级弹幕测试,CPU占用较高,在90%~99%区间内,视频播放流畅,没有卡顿。

整体性能媲美第10代酷睿、单核性能挑战酷睿最新旗舰

综合以上的测试及使用体验,我们可以得出结论:龙芯 3A6000是一款从制作工艺到性能水平都相当优秀的产品,是中国自主可控芯片中的佼佼者。它在全默认设定的性能确实如官方披露的信息所言,可以对标Intel第10代酷睿i3处理器。

更让我们未曾预料到的是,在相同频率、相同核心与线程数量情况下,它在上述测试软件中单核IPC甚至可以与英特尔最新旗舰处理器——酷睿i9-14900K掰手腕。

这意味着,假以时日,如果龙芯处理器的生产工艺能够进一步提升,多核之间的调度算法可以进一步精进,相信未来龙芯中科完全有可能制作出达到世界先进水平的处理器。

从现在的软件生态情况来看,这款处理器能够胜任大多数对于性能要求不高的应用环境。特别是在办公应用领域,由于龙芯整个平台是全自主可控研发,其数据安全得到极大的保障。而龙芯可以高效支持二进制翻译,又使得它兼容性也不错,可以转译运行一些为不同架构平台开发的软件。

一应俱全的文字、表格和图片工具,让用户面对较大的PPT文件也能运行得十分流畅丝滑。即使面对多网页浏览、4K画质视频播放、高级密集弹幕测试和简单的3D游戏,龙芯3A6000带来的使用体验都十分不错。

所以,我们推荐安全密级较高的企事业单位选用基于龙芯3A6000处理器的整机。对于希望支持国产硬件的个人用户,我们认为,基于龙芯3A6000处理器的整机,已经具备日常生活中的可用性,有心的玩家完全可以一起为龙芯贡献自己的力量!

友情提示

MCer请注意,由于微信公众号调整了推荐机制,如果你发现最近很难刷到Microcomputer(微型计算机)公众账号推送的文章,但是又不想错过微机的精彩评测内容,可以动动小手指把Microcomputer设置成星标公众账号哦!