不知道这里有没有相同的帖,有的话请斑竹删除.
感觉很有必要转一帖,就转了.
from:
http://bbs.cechinamag.com/冗余和热备有什么区别?
很多集成商把热备用做为冗余卖,这是有区别的,真正的冗余,两个控制器都接受信号,只是一个不往外送信号,这样切换的时间非常短,比如在紧急停车系统中应用;而热备用有一个切换的时间,只有一个控制器出现问题了,另一个控制器才接受信号,时间比较长。热备用你自己也可以做,比如在两个控制器中下装相同的程序,外部的信号通过继电器分两路送到控制器中.
冗余[redundancy redundance] :多余的重复或罗嗦话
冗余,指重复配置系统的一些部件,当系统发生故障时,冗余配置的部件介入并承担故障部件的工作,由此减少系统的故障时间
Redundan,自动备援,即当某一设备发生损坏时,它可以自动作为后备式设备替代该设备
冗余系统配件主要有:
电源:高端服务器产品中普遍采用双电源系统,这两个电源是负载均衡的,即在系统工作时它们都为系统提供电力,当一个电源出现故障时,另一个电源就承担所有的负载。有些服务器系统实现了DC的冗余,另一些服务器产品如 Micron公司的NetFRAME 9000实现了AC、DC的全冗余。
存储子系统:存储子系统是整个服务器系统中最容易发生故障的地方。以下几种方法可以实现该子系统的冗余。
磁盘镜像:将相同的数据分别写入两个磁盘中:
磁盘双联:为镜像磁盘增加了一个I/O控制器,就形成了磁盘双联,使总线争用情况得到改善;
RAID:廉价冗余磁盘阵列(Redundant array of inexpensive disks)的缩写。顾名思义,它由几个磁盘组成,通过一个控制器协调运动机制使单个数据流依次写入这几个磁盘中。RAID3系统由5个磁盘构成,其中4 个磁盘存储数据,1个磁盘存储校验信息。如果一个磁盘发生故障,可以在线更换故障盘,并通过另3个磁盘和校验盘重新创建新盘上的数据。RAID5将校验信息分布在5个磁盘上,这样可更换任一磁盘,其余与RAID3相同。
I/O卡:对服务器来说,主要指网卡和硬盘控制卡的冗余。网卡冗余是在服务器中插上双网卡。冗余网卡技术原为大型机及中型机上的技术,现在也逐渐被PC服务器所拥有。PC服务器如 Micron公司的NetFRAME9200最多实现4个网卡的冗余,这4个网卡各承担25%的网络流量。康柏公司的所有 ProSignia/Proliant服务器都具有容错冗余双网卡。
PCI总线:代表Micron公司最高技术水平的产品NetFRAME 9200采用三重对等PCI技术,优化PCI总线的带宽,提升硬盘、网卡等高速设备的数据传输速度。
CPU:系统中主处理器并不会经常出现故障,但对称多处理器(SMP)能让多个CPU分担工作以提供某种程度的容错。
所谓双机热备就是使用互为备份的两台服务器共同执行同一服务,其中一台主机为工作机(Primary Server),另一台主机为备份机(Standby Server)。
在系统正常情况下,工作机为应用系统提供服务,备份机监视工作机的运行情况(工作机同时也在检测备份机是否正常),当工作机出现异常,不能支持应用系统运营时,备份机主动接管工作机的工作,继续支持关键应用服务,保证系统不间断的运行。
什么情况下需要采用双机热备?
用户可以根据系统的重要性以及终端用户对服务中断的容忍程度决定是否使用双机热备。比如网络中的用户最多能容忍多长时间恢复服务?如果服务不能很快恢复会造成什么样的后果等。对于承担企业关键业务应用的服务器需要极高的稳定性和可用性,需要7×24不间断服务,推荐使用双机热备。
我已经有了RAID,以及磁带备份,还有必要做双机吗?或者,如果我做了双机备份,还有必要做磁带备份吗?
RAID和数据备份都是很重要的。但RAID技术只能解决硬盘的问题,备份只能解决系统出现问题后的恢复。而一旦服务器本身出现问题,不论是设备的硬件问题还是软件系统的问题,都会造成服务的中断。因此,RAID及数据备份技术不能避免服务中断出现,对于需要持续可靠地提供应用服务的系统,双机还是非常必要的。
数据备份是保障数据安全性的必不可少的措施。因为不论RAID还是双机,都是一种实时的备份。任何软件错误、病毒影响、误操作等等,都会同步地在多份数据中发生影响。因此,对于关键业务即使采用了双机方案也还是一定要进行数据的备份,以便能在数据损坏、丢失时进行恢复。
如何选择与实施双机热备的配置方案?
1. 以应用为主导,以高可用性为宗旨,分析需求的必要性;
2. 选择确定具体的设备、软件的型号等。需要注意的是: 不同的软件或是硬盘等存储设备,他们之间存在兼容性的问题,因此在购买之前应咨询专业人员,避免出现采购了双机软件后对相关的存储设备存在不兼容等现象。
3.在实施完成后,一定要进行测试,以确保工作正常,而且应注意在运行过程中定期的对系统是否能够正常切换进行测试。