近年我国数据中心发展迅猛,在数量和规模上都呈20%以上的年增长,特别是随着国家新基建政策的大力扶持,数据中心的发展建设处于高速发展时期。根据IDC的预测,到2025年,全球的数据规模将达到160ZB(160,000,000,000,000GB)左右。

这些数据大多以视频、图片、文本等非结构化形式存在,并需要妥善保存以做后续利用。为此,数据的存储载体需要具备随时随地上传、安全、可扩展以及低成本的特性。西部数据Data60/102安装简单且管理容易,将成为这些海量非结构化数据理想存储。

非结构化数据的存储主要有以下三个特点:

  1. 容量需求很大(PB级)
  2. 访问顺序度比较高
  3. 数据访问的热度较低

为什么要使用西部数据UltrastarData60/102?

我们从以下3个方面来说明:

•容量:西部数据UltraStarData60/102可以配置60/102块大容量硬盘,按照当前最大容量14TB硬盘计算,单台(4U)最大容量840TB/1.4PB,并且支持4台级联,则可以提供最大容量3.36PB/5.6PB的容量。非常好的满足了用户保存海量数据的要求。

•稳定性:UltraStarData60/102采用了散热和防震的专利技术,相比于同类产品,硬盘返修率大大降低了62%。

•性能:UltraStarData60/102配置了最多12个主机端口,每个主机端口带宽48gb,能非常好的满足不同客户的性能需求。另外,如果需要更高的读写性能,西部数据UltraStarData60/102支持最多24片SAS/SATASSD,可以软硬件结合,实现数据分层或者将SSD作为Cache来提高性能。

我们使用LSI9380的CacheCade测试时,发现使用SSDCache可以带来几十倍的性能提升,如下图示:

应用场景

我们以以下几个行业为例来说明UltraStarData60/102的应用场景。

一、医疗行业的存储需求:

基因检测正在步入大众的视野,尤其新冠病毒在全球肆虐,研究病毒基体需要大量的数据计算。通过检测基因,预测疾病已经成为可能性。基因测序产生的巨大数据量,对数据存储提出了严格的挑战。

主要存在如下挑战:

1.数据容量巨大

由于基因测序技术的提升,测序成本降低。从最初的人类基因组开始细分扩展,目前已经涉及到肿瘤,遗传病检测。扩展到植物,远古生物,细菌,病毒,微生物的基因检测。因此数据种类和数据量是异常庞大,经常以PB为单位保存。

2.性能瓶颈

基因测序往往采用多机集群计算,对存储的带宽和IO都有极高的要求,否则将大大降低测序的效率,延长了测序时间。

3.成本问题

基因测序成本不断下降,而数据存储由于日趋复杂,成本反而越来越高。如何降低中小规模基因测序的数据存储成本,成为一个困扰大家的难题。采用西部数据混合存储解决方案为基因测序提供了低成本、高性能的存储解决方案。单一系统高达PB级容量,具有高达8GB的读写带宽,与约10个节点构成的分布式存储性能相当。支持缓存加速功能,令集群计算随机IO性能提高百倍,大大缩短测序时间。而存储设备成本只有几分之一。因此,非常适合中小规模基因测序用户需求。

方案优势

•大容量:单一系统容量超过1PB,支持在线容量不断扩展,扩展后构成单一磁盘空间,不影响原来数据的使用。

•高性能:存储系统比同类产品读写带宽高一倍以上,保证高通量的数据读写。支持缓存加速功能,加速集群运算速度。

•高稳定:支持RAID6,允许同时损坏两块硬盘,通过容灾软件可以支持存储间远程复制,提供数据冗余备份,保证数据安全

•低成本:与同等性能的传统存储或分布式存储相比,存储设备投资成本降低一半以上。

二、JBOD存储部署

采用2台X86服务器作为集群服务器,每台服务器配置BroadcomRAID卡连接JBODUltrastar

data102存储,JBOD配置102个12TB的氦气盘,单个服务器配置2个存储节点,独立进行数据传输,总共8U的机架空间提供裸容量1.5PB存储容量

方案优势:

减少服务器需求,采购成本降低。

存储节点减少,管理成本降低。

使用西数氦气密封盘降低电费,节省机房机架空间占用。