正睿服务器  >  新闻中心  >  技术文章
新闻中心

存储入门三步曲——容量、稳定、容量与稳定之协调

间隙填充
正睿科技  发布时间:2007-05-27 10:14:56  浏览数:4319

存储入门三步曲1--容量之王RAID0

  服务器是一个企业级系统应用的灵魂,产品通过她进行设计,管理通过她进行决策,业务通过她进行支持……而所有这一切的应用又离不开一样东西,那就是??数据的交换与存储。今天在这里就谈谈服务器基础应用的存储。

  其实最早的服务器,比如文件服务器,只需要在最人性化的微软系统下(拿手边的XP PROFESSIONAL为例)就能简单实现:安装共享协议??>目标机器之间通过hub(也可用反线直接联通)联通??>选择磁盘(为了安全最好不要用C盘)新建一个文件夹??>选中所需的文件copy??>点击右键??>选择“共享和安全”??>选择共享栏里的“在网络上共享这个文件夹”,根据实际情况确定是否要选择“允许网络用户更改我的文件”。就这样,一个原始的文件服务器就建立起来了:所共享的文件夹就是服务器存储的文件。

  不过,这个“所谓的服务器”可就不是现在企业里任何一个服务器存储所考虑的范围了。现在的服务器存储考虑什么呢?容量、稳定、安全!

  很早以前,作为服务器应用里的核心基础,存储技术的发展一直没有间断过,其中,应用最广泛的莫过于RAID技术。在这里,笔者将以一个应用者的身份来介绍几种实用的RAID技术,以作为企业用户使用的参考。

存储入门之曲一:容量之王RAID0

概念

  容量很容易理解:企业管理的各个方面越来越多的依靠企业,社会的发展又迫使企业需要管理的信息越来越多,这就产生了早期的存储概念??海量存储。

  说到海量存储,肯定就会想到RAID0,因为海量存储就是在RAID0技术基础上开始推出并实现的概念,自诞生到现在,一直都有很大的市场,是很多中小企业海量数据存储的首要选择。

  笔者在此把RAID0定义为容量之王,主要是因为在预算的同等硬件配置里,RAID0是所有存储技术里容量最大的。

原理

  RAID0需要两块或两块以上同厂家、同型号、同容量的硬盘搭建,所组成的磁盘阵列是所有硬盘容量之和。如下图,组成磁盘阵列的有A与B两块硬盘,总容量等于A+B。

  在向RAID0阵列中存储数据A时,系统会将所存储的数据分成若干块,以头字标记的形式(其实在数据最原始组合的时候这个标记工作已经完成)分别存于阵列中的每个硬盘中,以方便日后读取时的重新排序组合;在从阵列中读取数据A时,又必须要从所有硬盘中来读取。具体的安装与使用过程不是很难,可以按照硬件厂家或软件商家提供的相关RAID0管理软件和操作手册导引来实现,这里不再赘述。

  当然,关于以上的原理需要特别强调一点,如果是PC机上设置的普通的主从盘连接,数据的存取都是在同一块硬盘以一个扇区或更大单位容量的区域里进行的。这一点与RAID0的存取方式截然不同。同样的两块硬盘,其在PC机上的数据传输与存储模式如下:

PC机

  这里还需要说明的是:a与b分别代表两条数据,a1+a2=a,b1+b2=b。这样,以上的两图对比就相对完整的表达了同样两块硬盘在PC机与RAID0的区别。

优点

  RAID0的原理决定了其两个重要优点:存储量大,读写速度快。

  RAID0需要至少两块硬盘来搭建,组成的RAID0阵列总容量为所有硬盘容量之和,相对一般只有一块硬盘的PC等来说,存储量肯定不会小了。

  RAID0存储数据和读取数据的过程,因为存储的每盘同时分配特点,读取也是同时从阵列里所有硬盘中同时读取出来的。这样比方,普通的PC就好像10个人从只容一个人缝隙的门里进去(或出来),需要30秒钟;把以上的平均速度作为标准,由10块硬盘搭建的RAID0架构呢,就好像10个人从10个同属以间房子但不同方位也只容一个人缝隙的门里进去(或出来),只需要3秒钟。很明显,同样大的文件,从RAID0里读取,肯定会比普通单磁盘读取要快很多倍。

  读取速度快,立足于信息管理与使用者的应用;容量的充分利用切合大多数信息化建设预算的需求。RAID0的这两个优点,使得企业在进行海量数据存储应用的时候有了很好的选择。

缺点

  俗话说,月满则亏。漂亮的中秋节一过,难免要面对月亮的半芽。

  RAID0的缺点和她的优点一样重要:因为读写原理的缘故,RAID0不具有数据冗余功能,任何一块硬盘的损坏都将使得所有数据遭受破坏。这也就需要企业在选择RAID0作为存储架构的时候,最好不要用在如商业资料等重要数据存储上,而只是作为企业自身定义为非重要数据??如娱乐网站等可再次获取的影音文件的存储上。

总结

  有朋友说RAID0就仿佛是存储里的农民技术,笔者没有深究到底含有多少贬褒。笔者这里要说的是,农民是所有人类的最初形式,是目前所有行业最多的人群。

  民以食为天!也就是这些农民,供应了我们日常生活的最基本??食!这就好象RAID0技术,完成了RAID技术的最基本形态??容量!

  虽然由于科技的进步,RAID早已经出现了很多更高层次应用,而且还出现了多种组合的优化模式,但是占有市场分额最多的还是RAID0,因为它满足了所有用户的保密级别较低的存储需求。

注:RAID0原理里提到需要两块同厂家同型号同容量的硬盘可以这样解释,如果不是同厂家同型号,因为设计时的参数不尽相同,在运行时必然导致系统运行的不稳定,极大的增加了数据存储系统崩溃的可能性;如果不是同容量的磁盘,那更简单,举个例子,如果你手里有三块同厂同型号的硬盘,它们的容量分别是10G、20G、30G,你觉得它们组成RAID0后的总容量是多少?60G?错!30G(单体最小容量×硬盘块数)!掰着指头算算,同样大的一只苹果,你花了人家三块甚至更多,结果呢?反而还不如人家的那只保鲜时间长!

 

存储入门三步曲2??稳定之王RAID1

  在存储应用之初,因为信息化的发展还不是那么的开放,掌握服务器RAID技术应用的只限于极少的一部分垄断企业群体,这一实际情况所带来的负面影响必然是设备建设投入的高企。对于追求利益最大化的企业来说,当然是希望投入最少的成本来获得更多的利益,因而,绝大部分需要存储应用的部门都选择了可以实现最大容量的RAID0技术。

  随着RAID技术的发展与市场的开放,在实际应用中,RAID0技术在系统稳定性方面的缺陷就慢慢凸现出来,而此刻,存储应用的设备采购成本也适时的进行了大幅的下调。于是,在服务器存储应用的重点开始向系统稳定性转移,更多的存储应用选择使用RAID1技术或实现从RAID0到RAID1技术的迁移。本章笔者将向大家介绍存储入门的RAID1部分。

RAID1示意图

 

存储入门之曲二:稳定之王RAID1
概念:

  看了笔者前文的介绍,读者应该能够对RAID1的存储特点有了初步的认识,那就是最大程度的实现系统的稳定性。

  系统运行的持续性,是作为服务器这个硬件灵魂的必须。笔者在以前介绍一家专业服务器厂商时,曾经提到过三年半这个数据??服务器实现三年半持续不关机,就是想要着重指出服务器运行德持续性要求。

  那么,怎么保障存储系统的稳定运行呢?这里有两个选择。

  第一,选择能够支持系统运行的超稳定服务器硬件。
  
  三年半不关机,这不是一个神话,那是笔者之前作为技术人员时,亲身经历的一件事。当然,我也不排斥各位朋友对于这个事实的怀疑。因为在笔者当时所效力的那家数据中心里,放在同一机柜,在同品牌、同型号、同配置,运行程序的读写率大致相同的另外几部服务器,其运行时间的持续最多也就刚刚过1年,其他品牌的服务器产品与这个品牌的平均持续时间还稍稍见短。

  第二,选择能够支持系统运行的超稳定服务器技术。

  对于存储技术来说,当然以采用镜像实时热备的RAID1最合适不过。

  以硬件成本的少量增加为代价,将组成阵列的双数硬盘以硬盘个体为单位进行容量的平均划分,进行双区实时备份,当一块硬盘出现故障甚至无法工作时,另外一块硬盘能够实现无缝的切换,实现了系统的超稳定运行??这也是笔者将RAID1称为服务器存储稳定之王的主要原因。

  第三,选择能够支持系统运行的兼容性操作系统。

  操作系统对于服务器所要实现的功能软件兼容性尤其重要。实际应用中,很多时候由于服务器运行程序的不同,选择操作系统所考虑更多的反而不是系统的稳定性,而是系统的兼容性??稳定性可以通过一些别的方式来弥补。

原理:

  RAID同样需要两块或两块以上的同厂家、同型号、同容量的硬盘来搭建,不过与RAID0不同的时,RAID1需要的硬盘数量必须是双数,RAID0不需要;所组成的磁盘阵列里,RAID0是所有硬盘容量之和,而在RAID1中则是所有硬盘容量的一半。

  RAID1的实质是实现单机数据热备的功能。

  双机热备的功能比较简单,相信大家应该都比较清楚,就是在两台机器上运行相同的系统,以软件来实现数据的双机互备,如果一台机器出现故障,马上通过管理软件进行切换,运行另外一部机器,以保障系统的稳定运行。RAID0的运行过程与双机热备原理基本一致,不同的是,RAID1是实现单机热备,在同一部机器所组成磁盘阵列的双数硬盘上,使用相关虚拟技术,对服务器硬盘进行平均分区,双区内运行中的每一个变化相互实时镜像存储,并进行冗余记录。当一块硬盘甚至一整个存储区域都突然出现故障时,另外一个硬盘存储区域仍然能够对之前的应用进行无缝运行,保证了系统运行的完整性。

  以四块硬盘组成的RAID1为例,四块硬盘分别编号A、B、C、D,A和C组成了阵列的1区,B和D组成了阵列的2区,1区与2区上运行同样的系统与数据库。若设定1区为主运行区,2区为数据备份区,那么1区和2区上将实现数据的实时同步更新,当1区出现系统运行故障时,管理软件自动将2区切换为主运行区域,系统仍然正常运转。

优点:

  看过以上的原理,相信大家已经很清楚RAID1的突出优点:系统稳定运行。

  现代企业的各项管理与业务运行越来越多的依赖信息系统,因为它可以进行数据的精确分析以协组管理人员完成业务整合、简化流程等工作,实现资源合理分配与成本节约的企业目标。如此以来,企业的运营与信息系统的运行就变得愈加不可分割,企业的稳定运行也很大程度上由信息系统的稳定运行来推进。作为企业信息系统的基础,服务器存储应用的稳定也理所当然的成为企业关注的焦点。而现对RAID0来说,冗余功能的实现,使得系统的完整数据实现了实时备份,RAID1无疑成为保障系统稳定运行的英雄。

缺点:

  有一句广告词说的好:没有最好,只有更好!

  在早期,由于容量极限的瓶颈制约,单体硬盘容量与接入硬盘数量的限制,而只能实现整体硬盘容量和一半的技术原理,使得RAID1技术只能支持相对少容量的实现。当然,随着技术的进步,这个瓶颈已经被攻克。但同样的硬件投入,RAID1却只能实现50%的数据存储,这对主管企业信息化建设的人员来说,还会有一种割肉的感觉。

注:由于技术瓶颈的攻克,后来衍生出RAID0+1的组合方式,在笔者看来,其实质也就是实现了RAID1的扩容(当然,也并不是单纯的扩容);另外,RAID1的管理软件并不是每家都支持自动切换功能??笔者之前效力的那家公司使用的RAID1主机就不支持自动切换,由于管理人员也不能一直坐在服务器前实时顶防,这在一定程度上消弱了RAID1实现的目的,所以请在购买时请与商家确认这一点;再者,RAID1实现的一些管理软件已经可以从网上获得破解版,一小部分区域也出现了服务器DIY的人群,可以帮助一些缺乏资金的创业型IT企业节约不少成本,但破解版的东西毕竟用起来不是很稳定,这跟RAID1所实现的目标方向截然相背;再者,提到笔者的原则立场,支持正版才是正道,建议各中小企业还是由硬件厂商和软件开发商处获得相关管理软件。

存储入门之曲三:容量与稳定协调之王RAID5

  在服务器存储的庞大市场需求下,RIAD技术普及速度也在成倍增长。此时,从大量用户反馈的信息知道,早期RAID0数据安全性的缺失和RAID1容量的损耗,分别对信息化建设中重要数据存储的安全与成本产生了很大程度的阻碍。如图,可以直观的显现RAID0与RAID1的工作原理。

 

RAID0

RAID1

(以上两图中,a=a1+a2,b=b1+b2)

  回顾前文,笔者介绍了容量之王RAID0与稳定之王RAID1各自的特性:RAID0实现了服务器存储中最大的容量,但是同时其安全性却没有任何保障;RAID1实现了系统的最大稳定与安全性,但同时牺牲了总体存储容量的一半,对于当时昂贵的高速传输硬盘来说,把成本提到了最高。

  那么,怎么才能实现存储中读取速度与数据安全性的兼顾,以达到服务器存储的最大效能呢?在这个前提下,RAID5以成本与性能的协调者身份应运而生。

概念:

  对于存储来说,容量与稳定都是必须要考虑的问题。有了容量,系统数据稳定性(在此更侧重数据的安全性)若不能保障,遇到故障,到头来只是一场空;有了稳定性,牺牲了容量这个存储的主要目的,却也有些舍本逐末。而RAID5就是在当时存储状况下产生的,主要是实现容量与稳定的和谐统一。

原理:

  RAID5需要三块或三块以上同厂家、同型号、同容量的硬盘搭建,硬盘需要支持热插拔,所组成的阵列容量是所有硬盘容量减去少于一块硬盘的容量之差。以三块硬盘组成的RAID5阵列为例,如下图,所组成的阵列中有A、B、C三块硬盘,A盘、B盘和C盘都负责存储数据,在三盘数据存储之外,还会在存储的同时自动生成奇、偶校验信息,分别存储在不同的硬盘里,占据相对微小的空间。奇偶校验信息耗费的空间有限,但恢复数据的能力却庞大无比。

RAID5

  当A、B、C盘中任何一块硬盘出现故障时,拔出故障盘,换上无故障的新盘,存储于另外一盘中的相对奇或偶校验,均能依据存储在不同盘中的奇、偶校验信息对数据进行有效的恢复。

  以上图的各盘数据包的恢复为例,当三块硬盘中的任何一块出现故障时,换上新硬盘,其恢复可以按照以下的过程来完成:

1)硬盘A故障:

  热插拔以新硬盘替换A,丢失的数据包a将依照B盘中的a-生成对应的a+校验信息,并在此配对信息基础上建立起原“数据包a”的模型,并将其恢复到故障前的“数据包a”的原貌。

2)硬盘B故障

  热插拔以新硬盘替换A,丢失的数据包b将依照A盘和C盘中的b+和b-校验信息组合,在此配对信息基础上建立起原“数据包b”的模型,并将其恢复到故障前的“数据包b”的原貌。

3)硬盘C故障

  热插拔以新硬盘替换C,丢失的数据包c将以B盘里的c+校验信息为基础,生成对应的c-信息,在此组合信息基础上建立起原“数据包c”的模型,并将其恢复到故障前的“数据包c”的原貌。

优点:

  RAID5的设计原理决定了其最大的优势:实现存储容量与系统稳定性(或称数据安全性)的和谐统一,最大程度的满足用户的存储需求。

  RAID5需要三块或三块以上的硬盘搭建,所组成的阵列容量为所有硬盘总容量减去少于一块硬盘容量的差值,由此而来的阵列容量介于RAID0与RAID1之间,这样,对于高速硬盘的高昂采购成本起了较为有效的照顾;RAID5通过占用每块硬盘空间的很少一部分对各硬盘存储的数据进行奇偶校验实时记录,当存储数据的一块硬盘出现故障时,通过热插拔设备马上更换新的硬盘上去,新的硬盘会在很短的时间内,以另外一块盘中存储的奇或偶校验值记录信息做依据,将故障硬盘内存储的所有数据进行有效恢复,这样,对于系统的稳定性(或数据的安全性)起了很好的补充。

缺点:

  笔者一直相信,在这个世界上没有绝对完美的东西,兼顾容量与稳定的RAID5同样不能幸免。

  RAID5的缺点总体来看,主要有以下两点:

1)存储速度有所降低。

  无可否认,当对磁盘内数据进行读取时,因为多块硬盘共享数据,使得服务器对于数据的读取速度相对单硬盘有了大幅提高,其实现如笔者在RAID0中所比拟的场景,采取多门多人出的方式,相对单门多人出的方式,其出门的速度要快的多。

  另一方面,作为RAID5保障系统稳定与数据安全的手段,当对数据进行存储时,由于要同时对存储的单个数据包进行双硬盘奇、偶校验信息备份,使得其存储速度相对单硬盘无校验存储的方式又有所降低。

2)数据的安全性相对折扣

  在我们所配置的RAID5中,采取如上文RAID5图所示三硬盘存储的方式,如果其中的两块硬盘同时出现故障,由于存储在两盘中的一些配对奇偶校验信息同时丢失,就再也无法找到能够恢复数据的备份信息,其后果必然是导致整体数据无法完整恢复。

总结:RAID5相对RAID0容量和RAID1稳定的极端表现,展示了更多的包容,实现了成本与性能的更加融合;另一方面,RAID5对于RAID0和RAID1的优点进行打折继承的同时,前两者的技术缺陷也在其身上以较为模糊的缺点形式显现。这也决定了一个现实的体现:在安全级别为中高级的数据存储市场,RAID5是目前应用最广泛的存储技术。

 

  • 正睿合作伙伴
  • 社区
首页 | 注册 | 网站地图 | 通告 | 联系我们
CopyRight(C)2004-2022 Chongqing Zhengrui Technology Co.,Ltd. All rights reserved.
重庆正睿科技有限公司(C)版权所有 未经书面授权 不得转载、复制或建立镜像
渝ICP备11002339号-1  渝公网安备 50010702500475号