在日前举办的年戴尔科技集团全球峰会(DTW)上,戴尔科技发布了下一代的PowerMax,这是自PowerMax年发布以来最大的一次升级,带来了2倍以上更快性能的提升,14倍以上的更高存储密度,并拥有2倍写带宽,50%更低的响应时间,以及7倍每节点容量,成为了名副其实的“关键任务型企业级存储。”
不仅如此,在戴尔存储历史中发展最快的存储新架构——PowerStore3.0也发布了多项新功能,同时其硬件平台也带来了全面的更新,包括支持下一代控制器,支持NVMe扩展,以及支持GbE网络等。也正因此,在提高工作负载性能方面,PowerStore3.0带来了多达50%更快的混合工作负载;多达70%更快的写操作;多达10倍更快的拷贝操作;支持多达8倍更多的卷,使得整个存储系统的有效容量增加了66%等等。
那么,为什么作为“第五代存储”的PowerMax和Powerstore性能提升会如此之大?这就不得不提到背后的“幕后英雄”——英特尔傲腾持久内存和英特尔傲腾固态盘,以及英特尔QAT硬件压缩技术。
在最近《CP谈“芯”——如何以“纳秒之速”领跑存储创新》的视频节目中,来自戴尔科技集团大中华区市场部高级顾问李君鹏和英特尔(中国)有限公司数据中心集团销售部非易失内存技术专家李波,就为我们详细解读了英特尔一系列新技术的发展趋势、应用和落地的情况,以及双方在联合创新中发生的“台前幕后”的故事。
以“纳秒之速”领跑存储创新
众所周知,作为戴尔科技集团高端企业存储产品系列的PowerMax,诞生三十多年来,PowerMax通过保持技术创新和迭代,以其高性能、高可靠以及高扩展等关键特性,不仅在“第五代存储”的发展中树立了行业的基准,更成为了众多企业数字化转型过程中关键型应用的核心支撑。
据了解,早在年PowerMax就率先实现了后端的NVMe,年则实现了前端的NVMeoverFabric(NVMe-oF),此举标志着PowerMax实现了端到端的NVMe,同时当年PowerMax也采用了双通道的英特尔傲腾固态盘,新一代介质的全面采用真正让PowerMax更大限度地提高了多控制器体系结构的性能,可达万的IOPS、GB/s的带宽和能够缩短50%的响应时间,让PowerMax成为了全球最快的存储阵列。
在此基础上,最新发布的下一代的PowerMax,更是在保护高价值数据、简化存储运维以及保持持续现代化方面都做了全面的革新,特别是通过采用DynamicFabric技术,让新一代PowerMax实现了低于60微秒的读延迟,以及低于微秒的写延迟,这对高端存储系统而言可以说是一次非常大的性能提升。
对此,李君鹏说:“PowerMax是业界第一个使用英特尔傲腾固态盘做持久存储的阵列,跟它前一代基于SASSSD相比,PowerMax通过采用NVMeSSD相比SASSSD的响应时间降低了25%,随后采用了英特尔傲腾固态盘以后,比SASSSD的响应时间更是降低了多达50%,而背后的原因不仅是软件的优化,更大的功劳还是源于英特尔傲腾固态盘,而这个响应时间的降低在高端存储中是非常显著的。”
在李波看来,基于3DXPoint介质打造的英特尔傲腾固态盘和目前市场上基于NAND芯片的NANDSSD其实有着本质的区别,傲腾固态盘是通过一个三维的按地址寻址的芯片,可以通过按位寻址的技术来实现读写操作的,整个过程当中不需要做垃圾回收,再加上芯片控制器中独特的算法设计,这样就能保证存储系统的带宽和延时有着极大的改善;而NANDSSD是以页面为单位实现读写操作,以块为单位实现擦除,整个过程当中会出现大量的垃圾需要回收,进而也就影响了性能的发挥。
“传统的NANDSSD有一个非常明显的短板问题,即NANDSSD的容量虽然单盘拥有15TB的容量,但是受到接口带宽和介质的限制,没有办法快速地把数据从盘里读取到CPU的内存上,进而影响到行业用户进行人工智能这样的计算需求,而英特尔傲腾固态盘由于采用了独特的介质,其每秒的吞吐量相当于8通道的高速,因此只要落了盘想要再提回来的时候,就可以进行直接读写操作,而类似这样的应用在银行、证劵、量化交易以及EDA设计中,都有着广泛的需求和应用。”李波说。
重新定义内存存储分层结构
事实上,从两位专家的谈话中也透露出了当前存储领域中出现的一个新变化趋势——就是存储正在进入分层存储的阶段,在“存储金字塔”结构中可以看到,存储每个层级的成本、性能、延时的指标都有量级的差异。其中,向上越靠近CPU,存储容量虽小但速度越快,距CPU越远,容量虽大但速度也慢,而内存在这个结构里起到的是“承上”(承接计算对数据的高速读写需求)以及“启下”(把需要频繁访问的热数据提取到读写速度更快的层级上)的关键作用。
而英特尔傲腾固态盘正是凭借其超高性能获得了越来越多客户的采用。不过,英特尔傲腾SSD也仅仅只是最近几年英特尔在存储介质领域创新的“代表作”之一,英特尔的另一大“杀手锏”则是英特尔傲腾持久内存,作为一种全新的内存接口形态,它在响应时间上天然有着巨大的优势,能够将整个存储系统的响应时间由“微秒”提升至“纳秒”级别,基本上做到了和DDR读取速度一样的响应级别,真正重新定义了内存存储的层次结构。
同样,英特尔傲腾持久内存与DRAM的不同之处还在于,它能以更经济的成本来扩展出更高的容量(即容量大,且有更高的数据存储密度/价格比),并具备数据非易失性,或者说是持久性。
此外,英特尔傲腾持久内存还提供两种使用模式:一种方式是内存模式,在这种模式下它就是单纯的价格便宜量又足,但断电后也不会保存数据的内存,可以作为DRAM内存的容量扩展搭档;另一种方式是Direct模式,这种模式下操作系统会将DRAM内存和英特尔傲腾持久内存视为两个独立的内存池,这样就使得英特尔傲腾持久内存可以像内存一样寻址,并像存储设备一样具备数据持久性,而这种持久性让其在机器重启期间也能保留此前加载的数据,从而能增加系统的业务弹性,缩短重启时间,提升业务恢复的速度。
当然,如果用户既对内存模式有需求,又有工作负载需要运行在AppDirect模式下,那么英特尔傲腾持久内存还可以激活第三种工作模式——双重模式,这种模式可通过预配置的方式,部分处于内存模式,其余部分则处于AppDirect模式,由此让用户可以实现“鱼和熊掌兼得”的目标。
李波表示:“目前很多的云服务提供商和互联网厂商都在大量地使用傲腾持久存储作为存储的全新解决方案,在实际的应用中,傲腾持久存储写操作的性能可以达到40微秒,读操作的性能可以达到20-30微秒。因此,包括元数据以及VDI这样的应用中,英特尔傲腾持久内存都能发挥重要的作用。”
以元数据为例,利用英特尔傲腾持久内存或者固态盘来保存元数据,可实现整体数据加速。李君鹏也补充表示:“PowerStore在年发布的时候也支持SCMOptaneSSD做持久存储,后来发现英特尔傲腾固态盘还有一个用法比较好,做元数据,PowerStore用英特尔傲腾固态盘做元数据,它的响应时间能降低多达15%。因此它特别适合一些极致类的交易场景,像股票交易、银行的核心交易系统或者电信的计费系统等等。”
同样在VDI应用中,随着远程办公和居家办公的兴起,因此现在VDI应用中虚拟机的密度也是各个厂家追求的目标,希望每台物理机能够支撑更多的VDI桌面,这样机房的占用空间、节能、制冷等都会实现更多的节省,而如果把英特尔傲腾持久内存引入到VDI应用中,则能够带大的性能提升以及整体TCO成本的降低。数据显示,VID应用中引入傲腾持久内存之后,内存容量提升高达33%;每个节点的虚拟机数量提升多达36%;而每个虚拟机的硬件成本降低多达30%,换句话说,如果把英特尔傲腾持久内存作为VDI中的大内存使用时,可以起到“事半功倍”的效果。
QAT硬件压缩技术的独特魅力
值得一提的是,在VDI应用中为了更好的提升性能,英特尔还提供了另一大“法宝”——英特尔QAT技术,该技术可基于硬件,加速网络安全、路由、存储和大数据等应用中常见的压缩和加密类工作负载,在提升处理器利用率的同时也能满足用户对安全的要求。
在戴尔科技最新发布的PowerStore中,利用英特尔QAT技术就实现了4:1的“压缩比”。“PowerStore在实际客户的应用场景中,多数的应用场景都能实现4:1的数据缩减率,且对性能不会产生影响,如此之高的数据压缩比是如何做出来的呢?其实就是采用了英特尔QAT硬件压缩技术,如果不用QAT的硬件压缩,它的响应时间和性能就会受到非常大的影响。”李君鹏表示。
具体来看,在PowerStore中主机写的I/O到PowerStoreCache中,一份是写在DRAM中,另外一份是写在NVRAM(非易失性缓存)中,同时在向后端写盘的时候,就会进入到一个压缩的过程,此时就会把一个8K的I/O进行压缩,然后再消重,压缩消重后会拼成一个比较大的I/O再写到后端的盘中,同时当读某一个I/O时,会自动进入解压缩的过程,这个时候英特尔QAT硬件加速的消重和压缩就用了“用武之地”,该技术在不利用主CPU的I/O周期,也能做到在线消重和压缩的“性能无损”。
李君鹏说:“其实在第四代存储中就采用了很多的全闪存,但是第四代全闪存中依然采用的是SASSSD,没有使用NVMeSSD,但SAS接口是为机械硬盘设计的,因此在这种应用之下是不能充分发挥NAND闪存的作用的,而NVMe则可以更好的发挥NAND闪存的价值,但如果打开消重和压缩,那么存储阵列的性能下降会非常大,一般压缩的性能就能下降20%左右,消重也会下降10%以内,如果加上消重/压缩的算法做得再不好时,那么性能会直接下降50%左右,因此产生的影响是非常大的,而PowerStore通过采用英特尔QAT技术,则完全化解这种挑战。”
更为关键的是,英特尔QAT不仅具有标准的压缩/解压缩能力,能够通过无损的数据压缩方式确保数据传输安全,保护静止数据;同时在在加密/解密方面也尤其独特之处,即英特尔QAT通过提供英特尔密钥保护技术(英特尔KPT),也可帮助保护加密私钥,借助英特尔KPT,用户在进入需使用私钥的虚拟机之前,私钥都会始终处于加密状态,而只有芯片中的英特尔QAT能够解密此私钥,这样密钥就得到了硬件层面更好地保护“加持”。
李波强调说:“过去通常来说都是通过CPU来计算加解密的,这样就会造成CPU的压力比较大,很多时候会发现存储中的CPU是满转的,但I/O吞吐这方面还在等CPU算完,但通过英特尔QAT技术,就可以最大化的提升加密/解密过程中的吞吐量。”
由此可见,充分利用英特尔QAT技术,无疑可以有效提升存储系统整体的加密和运算能力,显著降低硬件的支撑压力,大幅提升重删/压缩计算速度,降低前台的I/O的处理时延,从而有效提升全闪存存储实时业务的处理效率,进而为用户提供实时性更强、更具成本效应的全闪存存储服务,以及更好地应对当前爆发的海量小文件等存储问题。
推动存储介质持续创新和进化
毫无疑问,今天企业的数据不但保持着指数级的增长,同时其类型也越来越多样化,而存储的稳定性、可扩展性以及性能也需要“与时俱进”地保持升级和进化,因此,这就要求基于全新的存储介质,如持久化内存、全闪等新技术重构和改造原有的存储架构,来满足现在能够看到的,而且在未来越来越多的数据应用。
就这个话题,两位技术专家在对话的结尾也对未来存储介质的发展趋势做了相关的预测和分析。李波透露说:“英特尔在今年年末或明年年初的时候,也会发布下一代计算平台,内部代号为‘SapphireRapids’。”
据介绍,“SapphireRapids”计算平台有两大重要的技术创新,一是英特尔会在该平台中增加一个名为CXL总线的组件,它和传统的内存总线是不一样的,是在PCIeGen5的总线上又做了一层CXL的协议,在这种协议总线上就可以挂一些传统的StoreClassMemory,也就是通常业界所说的SCM,同时挂了SCM之后,依然能和内存保持缓存的一致性;二是,搭载了CXL总线的存储介质尽管速度比内存总线稍微慢一点,但是好处是它的容量会比内存容量大很多。
总之,基于“SapphireRapids”平台,英特尔会推出类似于内存的速度,类似于存储容量的一款产品,以实现对目前计算体系结构的“修补”,同时也能让热的数据放到DDR上,温数据放到傲腾持久内存中,而冷数据则可以放到傲腾SSD上,需要归档的数据则可以放到传统的HDD上,最终能够更好地满足用户对于目前存储介质创新的需求,进一步加速人工智能和大数据的计算。
而李君鹏最后表示:“今年戴尔科技提出了软件驱动存储创新的理念,核心是希望打造适应性更强的软件架构匹配存储系统演进的需求,一方面让客户的存储系统能够具备全面的网络弹性,另一方面也能够获得多云的控制和移动性,更好地适应未来数字化转型的需求。”
可以预期的是,未来越来越多的企业利用创新的存储介质和技术实现对“存储金字塔”中内存和存储的替换速度还会加快,而英特尔也正通过和戴尔科技这样的合作伙伴的深度合作,以“纳秒之速”领跑存储创新,并持续推动存储介质的创新和进化,更好地承载用户的关键业务和极致应用的落地,最终为企业的数字化转型提供更强大的支撑力。