大容量存储的未来:发力硬盘面密度创新,夯实人工智能基石

作者:希捷全球执行副总裁暨首席商务官 郑万成

1897年,作家马克·吐温在读到自己讣告时调侃道:“关于我的死亡报道,被严重夸大了。”同样,在数据存储行业,机械硬盘多年来也经历着诸如江河日下等被夸大的报道。

然而,就像这位“被死亡”但此后健在多年且颇为高产的作家马克·吐温一样,机械硬盘也同样得到长足发展,存储了超大规模云数据中心近90%的数据,而世界上绝大多数EB级数据都存储于这些数据中心。随着云和人工智能生成的数据量急剧增加,对大容量存储的需求之大前所未有。

当然,存储需求的提升并非什么新鲜事。新鲜的是需要存储的数据飞速增长。市场研究机构IDC预测,2027年,全球产生的数据量将达到291ZB,而在2023年,该数据为129ZB,相当于2022-2027年复合年增长率为22.4%(来源,IDC全球数据圈预测,2023-2027年,#US50554523,2023年4月)。

据Statista称,从2010年到2022年,全球创建、存储、复制和消费的数据量增加了60倍,并且这一速度还将继续加快。

推动这一趋势的是生成式人工智能和大语言模型的部署。由于需要大量数据来训练和优化,最好的人工智能模型在很大程度上依赖于大容量数据存储。领先的公司将越来越希望保留其原始数据集和人工智能处理的结果。

以特斯拉为例,特斯拉从世界各地道路上的数百万辆电动汽车收集大量数据,用于训练人工智能驾驶模型和地图绘制。

社交媒体是另一个例子:Facebook、LinkedIn、小红书和YouTube等平台收集大量数据,用人工智能进行分析。2023年,6798亿美元的全球广告收益证明了该商业模式的成功。

世界经济论坛在一项调查中表示,75%的受访公司预计在未来五年内采用人工智能技术来增强其产品和服务并提高生产力(来源:世界经济论坛,2023年5月)。

总之,我们预计ChatGPT、文心一言(Ernie Bot)和Bard等生成式人工智能技术将在未来五年内创建100ZB的数据。

存储所有数据

为了应对数据增长,需要更多的存储容量,这就进一步需要更多的物理数据中心来容纳面密度和容量更高的存储设施。

大多数通信服务提供商和数据中心运营商都会混合采用机械硬盘和固态硬盘。他们设计的存储架构由精心优化的存储介质组合而成,考虑了支持的工作负载的成本、容量和性能要求。

随着数据量的飙升,对机械硬盘和固态硬盘的需求将继续居高,机械硬盘服务大容量工作负载,同时,固态硬盘解决具有更高性能要求的工作负载。

数据的指数级增长将成为促进大容量机械硬盘需求的关键驱动力,机械硬盘与闪存的协同作用将继续支持现代工作负载。

硬盘继续扮演关键角色

为了应对所预测的数据存储增长,硬盘必须在存储容量方面做得更好,这意味着硬盘的面密度需要大幅增加。幸运的是,硬盘行业一直在努力解决这个问题,引入了新的技术,如热辅助磁记录(HAMR),可以成倍地扩展碟片密度。希捷第一代HAMR硬盘每个碟片容量为3TB,相比之下,传统PMR硬盘单碟片最高容量为2.4TB。预计未来几代HAMR硬盘将进一步将面密度提高到单碟片容量4TB或5TB。这相当于在不久的将来,我们将拥有40TB-50TB的大容量硬盘。

硬盘外形规格不变的情况下增加容量,这有利于数据中心轻松地在现有硬盘寿命结束时进行更换,以最低的成本扩展整个数据中心的存储容量,且几乎不会造成业务中断。在多PB和EB规模上,将16TB的传统PMR硬盘替换为30TB的HAMR硬盘可以显著节省功耗和其他运营成本。

事实上,由于数据中心对耗电量和国家发电能力的影响,世界上许多国家都暂停了数据中心的部署。硬盘面密度的创新是许多数据中心运营商在有限资源下管理数据激增问题的一个强有力解决方案。

规模上的可持续性

从规模上看,面密度创新使企业能够在现有空间中找到更多空间。HAMR技术可以极大地增加数据中心的容量,而无需增加数据中心的占地面积和成本。

一般来说,面密度等于更环保的数据中心和更可持续的存储。提高能源效率可减少数据中心对环境的影响和运营成本,同时从长远来看,可以提高性能。同一数据中心占地面积内的数据越多,意味着有功功率(每TB瓦数)的大幅降低;它帮助企业可持续运营并实现其碳减排目标。

结论

在人工智能的浪潮风靡全球时,当前行业的目光主要聚焦在人工智能的颠覆性潜力、对人工智能处理器和计算引擎不断增长的需求、以及对云存储容量的需求。然而,这往往忽略了云存储实则依赖于硬盘而存在的事实。为了充分发挥人工智能的潜力,我们需要通过增加面密度来大幅增加硬盘的容量。随着希捷开始批量生产HAMR硬盘,硬盘行业已做好准备去应对这一挑战。