下一代数据存储技术研究报告(2021年).pdf
《下一代数据存储技术研究报告(2021年).pdf》由会员分享,可在线阅读,更多相关《下一代数据存储技术研究报告(2021年).pdf(44页珍藏版)》请在咨信网上搜索。
1、 下一代数据存储技术下一代数据存储技术 研究报告研究报告 (2021 年)年)中国信息通信研究院云计算与大数据研究所中国信息通信研究院云计算与大数据研究所 20212021 年年 7 7 月月 前前 言言 伴随着信息技术的迅猛发展,以寄存器、缓存、主存、外存等构成的多级数据存储系统已成为现代信息系统不可或缺的底层基座。近年来,随着移动互联网和物联网的飞速发展,数据存储系统面临的业务环境呈现出两大特点:一是数据量爆发式增长,规模到达EB级、访问频率到达亿级每秒;二是现代业务负载动态变化,需要极强的弹性伸缩和智能资源管理能力。传统数据存储系统受限于介质、架构、协议等因素,其能力逐渐出现瓶颈,无法满
2、足业务需求,这催生了下一代数据存储技术。下一代数据存储技术指在存储介质、存储架构、存储协议、应用模式及运维模式等方面迭代创新的一系列技术的集合,总体呈现高性能、易于扩展、服务化和智能化等特点。数据存储技术革新从根本上改变着数据存储产品的形态。如何围绕下一代数据存储技术,构建一套稳定、高效、满足未来业务发展需求的数据存储系统,是企业和组织夯实数据底座、挖掘数据价值、释放数据潜能的关键。本报告聚焦于企业级存储系统,从数据存储技术面临的挑战切入,详细梳理了下一代数据存储技术,跟踪重点行业的应用动态,并展望了存储产业发展趋势。力图展现下一代数据存储技术路径及其发展前景。由于时间仓促,水平所限,错误和不
3、足之处在所难免,欢迎各位读者批评指正,意见建议请发送至 。目目 录录 一、存储产业与技术概述.1(一)存储技术发展史.1(二)存储技术分类.3(三)存储产业市场简析.7(四)存储产业痛点分析.11 二、下一代数据存储技术详解.13(一)存储介质演进.13(二)存储架构演进.17(三)存储协议演进.21(四)应用模式演进.24(五)运维模式演进.25 三、下一代数据存储技术赋能数字化转型.27(一)异构数据统一管理能力推动数据湖产品演进.28(二)多级存储介质助力实时分析能力构建.29(三)云存储备份简化数据安全实践路径.30 四、下一代数据存储技术实施建议.31(一)指导原则.31(二)实施策
4、略.34 五、总结与展望.36 参考文献.39 图图 目目 录录 图 1 存储介质发展简史.1 图 2 存储技术架构.4 图 3 存储市场全景图.8 图 4 中国企业级存储市场空间.8 图 5 中国存储市场总览.9 图 6 中国存储市场介质使用情况.10 图 7 闪存及机械介质成本预测图.10 图 8 非易失性存储介质.15 图 9 软件定义存储逻辑架构示意图.18 图 10 超融合基础架构图.20 图 11 超融合基础架构特征.20 图 12 基于 FC 和 SAS 协议的经典存储网络.22 图 13 基于 NVMe 协议的 IP 存储网络.24 表表 目目 录录 表 1 下一代数据存储技术
5、革新方向.13 表 2 机械硬盘与固态硬盘性能对比.14 表 3 新型非易失性存储简介.15 表 4 不同类型软件定义存储简介.18 下一代数据存储技术研究报告(2021 年)1 一、存储产业与技术 (一)(一)存储技术发展史存储技术发展史 数据的存储从古至今都是人类活动的重要环节。早在语言文字还没有形成时,人类就已经开始探索使用树枝和石头来记录信息。从结绳记事到刻画在岩石上的象形文字,再到甲骨文的出现,从竹简、纸张的发明,到活字印刷、打孔卡等科技进步,人类探索世界得到的信息和数据不断积累,代代传承,提升了人类认识、改造世界的能力。对信息沟通量与质的不懈追求,促使人类探寻更大容量、更高性能的存
6、储模式,推动开发和应用更多更先进的数据存储技术,使数据更好地储存和交互,提高数据使用的便捷性与持久性。20世纪20年代以来,伴随着电子技术的发展,存储技术进入了崭新的时代。来源:中国信息通信研究院 图 1 存储介质发展简史 1928年,可存储模拟信号的录音磁带问世,每段磁带随着音频信号电流的强弱不同而被不同程度的磁化,从而使得声音被记录到下一代数据存储技术研究报告(2021 年)2 磁带上。1951年,磁带开始应用于计算机中,最早的磁带机可以每秒钟传输7200个字符。20世纪70年代后期出现的小型磁带盒,可记录约660KB的数据。1956年,世界上第一个硬盘驱动器出现,应用在IBM的RAMAC
7、305计算机中,该驱动器能存储5M的数据,传输速度为10K/S,标志着磁盘存储时代的开始。1962年,IBM发布了第一个可移动硬盘驱动器,它有六个14英寸的盘片,可存储2.6MB数据。1973年,IBM发明了温氏硬盘,其特点是工作时磁头悬浮在高速转动的盘片上方,而不与盘片直接接触,这便是现代硬盘的原型。1967年,IBM公司推出世界上第一张软盘。随后三十年,软盘盛极一时,成为个人计算机中最早使用的可移介质。这个最初有8英寸的大家伙,可以保存80K的只读数据。四年后,可读写软盘诞生。至上世纪九十年代,软盘尺寸逐渐精简至3.5英寸,存储容量也逐步增长到250M。截止1996年,全球有多达50亿只软
8、盘被使用。直到CD-ROM(只读光盘,Compact Disc Read-Only Memory)、USB存储设备出现后,软盘销量才开始下滑。进入21世纪,信息爆炸导致数据量成倍增长,硬盘容量也在飙升,单盘容量已可达到TB级别。即便如此,单块磁盘所能提供的存储容量和速度已经远远无法满足实际业务需求,磁盘阵列应运而生。磁盘阵列使用独立磁盘冗余阵列技术(RAID)把相同的数据存储在多个硬盘,输入输出操作能以平衡的方式交叠进行,改善了磁盘性下一代数据存储技术研究报告(2021 年)3 能,增加了平均故障间隔时间和容错能力。RAID作为高性能、高可靠的存储技术,已经得到非常广泛的应用。21世纪以来,计
9、算机存储技术飞速发展,如何快速高效的为计算机提供数据以辅助其完成运算成为存储技术新的突破口。在RAID技术实现高速大容量存储的基础上,网络存储技术的出现弱化了空间限制,使得数据的使用更加自由。网络存储将存储系统扩展到网络上,存储设备作为整个网络的一个节点存在,为其他节点提供数据访问服务。即使计算主机本身没有硬盘,仍可通过网络来存取其他存储设备上的数据。基于网络存储技术,分布式云存储、容灾备份、虚拟化和云计算等技术得以广泛应用。数据存储,是现代信息产业架构中不可或缺的底层基座。经过百余年的发展,存储技术已经呈现出非常多的形态,且仍在不断完善和创新,以适应日益增长和不断变化的数据存储需求。(二二)
10、存储技术存储技术架构架构 现有存储系统从底层到上层由存储介质、组网方式、存储协议和类型、存储架构、连接方式五个部分组成,整体架构如下图。下一代数据存储技术研究报告(2021 年)4 来源:中国信息通信研究院 图 2 存储技术架构 1.存储介质 企业级存储中的存储介质包括机械磁盘(HDD)、固态硬盘(SSD)、磁带(TAPE)、光盘(Optical Disk)等,其中最常见的是以HDD和SSD为介质的存储系统。依据存储介质不同,存储系统可分为磁盘存储、全闪存储、混闪存储、磁带库、光盘库等。磁盘存储:指全部以磁盘为永久存储介质的存储;磁盘性能一般,但价格便宜。全闪存储:指全部以固态硬盘为永久存储介
11、质的存储;全闪存储性能优异,但价格也较高。混闪存储:指永久存储介质同时含有磁盘和闪存盘的存储;与全闪存储相比,混闪存储在性能和价格上进行了一定折中。下一代数据存储技术研究报告(2021 年)5 磁带库和光盘库:指以磁带或光盘为存储介质,由驱动器及其控制器组成的存储设备;单位存储空间价格较低,支持冷数据的长期保存,但读写性能不高。2.组网类型 按组网方式,存储系统可分为IP(互联网协议,Internet Protocol)组网存储、FC(光纤通道,Fiber Channel)组网存储、IB(无线带宽,InfiniBand)组网存储等。IP 组网存储:指采用以太网技术进行组网的存储设备,常见速率包
12、括 1Gb、10Gb、25Gb、100bG 等;IP 组网的兼容性较好,建设成本较低。FC 组网存储:指采用 FC 光纤技术进行组网的存储设备,常见速率包括 8Gb、16Gb、32Gb 等;FC 组网的效率较高,但采购成本和维护难度也相对较高。IB 组网存储:指采用 InfiniBand 技术进行组网的存储设备,常见速率包括 40Gb、56Gb、100Gb、200Gb 等;IB 组网的延迟较低、速率较高,但采购成本相对较高,组网的扩展性也较弱。3.存储类型 按存储类型,存储系统可分为文件存储、块存储、对象存储、其它存储等。下一代数据存储技术研究报告(2021 年)6 文件存储:指自身构建文件系
13、统后,通过互通的网络提供给服务器或应用软件使用,支持数据文件读写和文件共享服务的存储设备。文件存储的常用协议包括NFS、CIFS、FTP等。块存储:指将物理存储介质上的物理空间按照固定大小的块组成逻辑盘,并直接映射空间给服务器使用的存储设备。块存储的常用协议包括SCSI、iSCSI、NVMe等。对象存储:指采用扁平化结构,将文件和元数据包装成对象,并抽象成网络URL(统一资源定位器,Uniform Resource Locator),通过HTTP(超文本传输协议,Hypertext Transfer Protocol)协议直接访问的存储设备。对象存储的常用协议包括S3、SWIFT等。其它存储协
14、议:包括在大数据存储中广泛使用的HDFS协议,以及表存储协议等。4.存储架构 按存储系统架构,存储系统可分为集中式存储和分布式存储。集中式存储:指基于双控制器或多控制器架构的企业级存储系统,具有较强的纵向扩展(Scale-up)能力和一定的横向扩展(Scale-out)能力。集中式存储的特点有高可靠、高可用、高性能等。分布式存储:指将商用服务器上的存储介质虚拟化成统一的存储资源池来提供存储服务。分布式存储的特点有高扩展性、低成本、易运维、和云紧密结合等。下一代数据存储技术研究报告(2021 年)7 5.连接方式 按连接方式,存储系统可分为SAN存储、NAS存储、DAS存储。SAN:Storag
15、e Area Network(存储区域网络),指通过光纤通道交换机、以太网交换机等连接设备将磁盘阵列与相关服务器连接起来的高速专用存储网络。NAS:Network Attached Storage(网络附加存储),是一种专业的网络文件存储及文件备份设备,对不同主机和应用服务器提供文件访问服务。DAS:Direct Attached Storage(直接附加存储),将存储设备通过 SCSI(小型计算机系统接口,Small Computer System Interface)接口或光纤通道直接连接到一台主机上,主机管理它本身的文件系统,不能实现与其他主机的资源共享。各类型数据存储技术仍在不断的完善
16、和创新,以适应日益增长和不断变化的数据存储需求,形成了多层级、广泛覆盖的产品体系结构,为用户提供了各应用场景下的存储解决方案。(三三)存储产业市场存储产业市场纵览纵览 根据统计机构国际数据公司(IDC)的定义,一般意义上的企业存储市场特指的是企业级存储系统(ESS,Enterprise Storage System)市场,它在存储整体市场中的位置如下:下一代数据存储技术研究报告(2021 年)8 来源:IDC 图 3 存储市场全景图 据IDC的预测,2021年中国企业级存储市场空间55亿美元,2020-2024年中国企业级存储市场将保持7.16%的年复合增长率,到2024年中国企业级存储市场空
17、间将达到65.9亿美元。数据来源1:IDC,2020 图 4 中国企业级存储市场空间 1 数据来源:2020Q3 IDC Enterprise Storage System Market Overview。下一代数据存储技术研究报告(2021 年)9 存储市场按照存储架构可以分为传统企业级存储(TESS)、软件定义存储(SDS)、超融合基础架构(HCI)。据IDC统计,2020年Q1-Q3中国存储市场中传统企业级存储占比59.2%,仍是最主流的存储架构,SDS软件定义分布式存储占比22.2%,HCI超融合占比18.6%。SDS和HCI的增速远远超过TESS,其中SDS未来四年复合增长率12.8
18、%,HCI未来四年复合增长率13.0%。分布式存储在政府、运营商、金融、企业、教育、医疗、能源等众多行业被广泛接受和采用。以中国移动为代表的运营商更是在2021年的集采中大量采购分布式存储,构建存储资源池,全面替代以前的中低端存储。数据来源2:IDC,2020 图 5 中国存储市场总览 存储市场按照存储介质可以分为全闪存储(AFA)、混闪存储(HFA)、全机械盘存储(HDD)。2020年Q1-Q3中国存储市场中全闪存储占比18.2%,混闪存储占比28.6%,两者之和接近50%,且全闪存存储的增速较快,较2019年Q1-Q3同比增长20%。2 数据来源:2020Q3 IDC PRC Softwa
19、re-defined Storage and Hyperconverged System Market Overview。下一代数据存储技术研究报告(2021 年)10 数据来源3:IDC,2020 图 6 中国存储市场介质使用情况 在全球存储市场中,由于闪存成本不断下降,全闪存储份额快速增加,市场占比超过20%。根据第三方机构Wikibon的预测,2026年SSD单TB成本将低于HDD,达到15美元/TB。2025年后,HDD的出货量将每年下降27%,只应用于扩容和归档等少数场景。数据来源:Wikibon,2021 图 7 闪存及机械介质成本预测图 3 数据来源:2020Q3 IDC Ent
20、erprise Storage System Market Overview。下一代数据存储技术研究报告(2021 年)11 随着国内存储厂商的技术进步及国家自主创新的政策激励,国产存储厂商份额不断提升,国产化存储产品也逐渐被用户接受。在传统存储阵列领域,当前市场份额较大的厂商包括华为、新华三、浪潮、曙光等;在分布式存储领域,华为、曙光、新华三、XSKY等厂商占有较大市场份额。而在云存储领域,阿里云国内领先的云存储厂商。(四四)存储产业痛点分析存储产业痛点分析“数据”是数据中心乃至企业最重要的资产。在数字社会,数据具有基础战略资源和关键生产要素的双重角色。作为信息化系统中的核心部分和底层基座,
21、存储系统的构建和使用直接关系到数据这一企业核心资产的存储、使用和挖掘。当前,存储系统面临的业务环境呈现出以下两个特点。一是数据量爆发式增长。随着移动互联网不断发展,企业的数据规模呈现爆发式增长。IDC:2025 年中国将拥有全球最大的数据圈研究表明,2018 年中国新增数据量为 7.6ZB,成为世界第一数据生产国;2025 年中国新增数据量将达到 48.6ZB,年平均增长率为30%。二是业务负载呈现动态变化。现代业务平台的负载是非线性的、动态变化的,尤其是互联网类的业务,随时可能出现业务负载的突发性变化。以 2020 年双十一为例,0 点至 0 点 30 分,天猫实时成交额突破 3723 亿。
22、订单创建峰值为 58.3 万笔/秒,是 2009 年第一次双十一的 1457 倍。下一代数据存储技术研究报告(2021 年)12 当前存储技术存在以下四个问题,导致难以满足上述业务需求:一是主要采用集中式架构,横向可扩展性差。传统存储由于紧耦合架构和单一的协议,导致性能和空间无法独立扩容,支撑业务快速部署上线。相较于计算虚拟化环境下秒级的虚拟机部署和回收,存储的扩容和资源分配往往需要几个小时甚至几天以上的时间,难以满足客户快速扩展的需求。如何提高存储系统的横向扩展能力,实现对资源的即时使用和释放,是未来存储技术亟待解决的问题。二是无法统一调度,存储容量浪费。受限于架构设计,不同存储之间的资源无
23、法进行统一调度和管理,时常出现个别节点资源存在剩余,但其他节点却出现空间不足的情况。存储整体利用率低,造成存储、计算资源浪费。大数据时代,这一问题被进一步放大,如何减少资源浪费、降低使用成本将是未来各行业用户关注的重点。三是产品兼容交互能力差,业务复杂性变高。据IDC FutuerScapes 2019分析指出,未来企业 49%的应用将与其他应用有紧密关联,每个企业级应用都将与其他 4-8 个应用有频繁的交互。不同供应商或型号存储产品往往难以互通,当需要替换存储设备时,数据迁移问题无论对运维还是业务平台本身都是一项极大的挑战。四是多种存储产品混合使用,运维难度大。目前我国各行业用户采购的存储产
24、品往往由多家厂商供应,由于接口、协议、工具的差异,造成了诸如业务复杂性变高、运维成本上升等问题。如何打破“数据孤岛”,避免重复式存储规划和数据丢失带来的损失成为企业数字化转型过程中面临的一大挑战。下一代数据存储技术研究报告(2021 年)13 为了解决上述问题,满足各行业在使用存储系统过程中出现的新场景、新需求,下一代数据存储技术应运而生。二、下一代数据存储技术 进入移动互联网时代,存储应用场景急剧变化,下一代数据存储技术应运而生。下一代数据存储技术主要指在存储介质、存储架构、存储协议、应用模式及运维模式等方面迭代创新的一系列技术的集合,总体呈现出高性能、易于扩展、服务化和智能化等特点。表 1
25、 下一代数据存储技术革新方向 技术分类技术分类 传统存储传统存储 下一代存储下一代存储 存储介质存储介质 机械硬盘存储、易失型内存 全闪存储、非易失性内存 存储架构存储架构 集中式存储 软件定义存储、超融合基础架构 存储协议存储协议 AHCI、SCSI 协议 NVMe 协议 应用模式应用模式 本地部署 云服务化 运维模式运维模式 人工运维 智能化运维 来源:中国信息通信研究院 本章将从这五个方面对下一代数据存储技术的演进进行梳理与分析。(一一)存储介质演进存储介质演进 1.全闪存储 全闪存储指全部由固态存储介质构成的独立存储阵列或设备。全闪存储的高速发展,既是新应用对性能需求驱动的结果,也是闪
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 下一代 数据 存储 技术研究 报告 2021
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。