许多企事业单位虽然已经认识到信息安全的重要性,却迟迟没有行动。其中的原因是多方
面的,最主要的一个原因就是在如何建立容灾系统的问题上存在种种疑惑。容灾设计指标
主要与容灾系统的数据恢复能力有关,最常见的设计指标有 RTO 和 RPO。RPO 是指能把
数据恢复到过去的那一个时间点,RTO 是指在出现问题后“什么时候”可以恢复数据。
RPO 可简单地描述为企业能容忍的最大数据丢失量。为了更好地理解,可以想一下传
统数据备份方式,一般备份都是一天做一次,通常是在晚上。如果第二天出现错误,那从
备份完成后到错误出现时所写入的数据都无法挽回了,这期间没有备份,数据就丢失了!
如果错误出现在一天结束时,那一天的数据都丢失了,这种情况下,RPO 就是 24 小时。
为了改进 RPO,数据保护必须更频繁地进行。大多数情况下,增加备份的频率是不现
实的。原因有:1.应用的高峰时段无法进行备份操作;2.备份数据所花时间太长。为了改
进 RPO,需要有新的方法,这种方法就是恢复管理,用连续复制和快照技术能有效地改进
RPO。
RTO 可简单地描述为企业能容忍的恢复时间。在传统的数据保护中,备份数据是不能
立即使用的,必须先恢复。对象级别的恢复功能可以有效恢复单个的目标,如一个文件或
一封邮件,甚至是许多文件和邮件的集合。然而,恢复整个数据库和海量数据时仍需要时
间。
要解决这个问题,不得不对生产数据进行复制,创建镜像快照或连续复制,或两者都
做。因为复制是在线的,能立即投入使用,整个数据库或海量数据的 RTO 也许只有 5 分钟
或更短。
然而在设计一个容灾系统时,不能过分追求 RPO 和 RTO,因为 RPO 和 RTO 越小,
投资将越大。而总体投入成本越高,投资回报率将越低。从经济角度考虑,最佳的容灾解
决方案不一定是效益最好的容灾解决方案,因为容灾系统的总体投入 TCO 和投资回报
ROI,对于许多用户来说是十分重要的设计指标。
数据保护一般有 3 个技术手段实现:持续可用、快速恢复、可以恢复。这 3 种方式的
投资和造成数据丢失是不同的,请看图 1。
由此可以看出,不同的 PRO 指标实现的代价和方式都不同。而这些技术手段的 RTO
也是不同的,请看图 2。