查询EBS备份实例+S3备份+快照



我花了很多天的时间研究在亚马逊上安装两台Windows服务器,一台域控制器和一台远程桌面服务服务器,但有几个问题我找不到详细的或任何答案:

1) 当您有一个EBS支持的实例时,我认为这意味着所有文件(OS/Applications/Pagefile)等都存储在EBS上?在数据中心中,假设我有50个操作系统文件/应用程序数据等,这些都存储在一个SAN类型的设备上吗?如果该设备爆炸,或者说特定的数据中心被摧毁,会发生什么。数据在别处吗?您的整个EBS卷消失的概率是多少?

2) 据我所知,您可以使用快照将EBS实例备份到S3。我想你可以选择拍摄快照的频率(比如每天?)。在我上面的场景中,如果我有50个gig的文件,并且每天快照一次。在7天内,我的S3存储将是350吉比特,还是50吉比特+我在一周内所做的增量更改?

3) 我记得在某个地方读到实例必须脱机才能进行快照。如果是这样的话,它是通过关闭客户操作系统、快照然后启动来做到这一点,还是只是分离数据,阻止您在它进行快照时进行连接,然后将其恢复到进行快照之前的确切时刻。

4) 我理解每月为每一场演出的空间付费的概念,但我对每100万次I/O请求0.11美元的担忧。当我运行windows服务器时,这是如何工作的?我不知道服务器对其磁盘发出了多少I/O请求。我假设整个虚拟机的大部分都存储在EBS卷上。在标准EBS上运行服务器会从根本上降低速度吗?

5) 人们是否使用S3的快照作为主要备份?人们是否正在运行其他类型的数据备份?

很抱歉有任何问题-如果有人能给我部分答案、答案或建议,我将不胜感激。提前感谢!

1)亚马逊在这方面很模糊。他们说,数据是在其所属的AZ内复制的,如果自上次快照以来更改的数据少于20GB,则每年的失败率约为0.1-0.4%

2) 快照是手动触发的,并且是增量完成的

3) 取决于您的文件系统。例如,在带有xfs卷的linux盒子上,您可以冻结卷的IO,执行快照(只需一秒钟左右),然后解冻。如果您在不执行类似操作的情况下拍摄快照,则会存在数据处于不一致状态的风险。这将取决于您的文件系统

4) 我在EBS上运行所有实例。您可能不希望您的页面文件在EBS上,使用实例存储会更有意义。您使用的IO数量将在很大程度上取决于工作负载。IO数量在很大程度上取决于您的工作负载——例如,应用程序服务器的IOP要比数据库服务器少得多。如果你运行的是特别重IO的操作,你不太可能每月每个卷使用超过几美元

5) 就我个人而言,我不在乎安装的软件/配置(我有所有设置的AMI,所以我可以在几分钟内恢复),我只在乎数据。我单独备份了这些数据(S3和Glacier)。部分原因是我被EBS大约一年前的一个错误所困扰,他们丢失了一些快照

正如范蒂乌斯所评论的那样,你也使用多种策略。例如,在我运行的mongodb服务器上,启动卷很小(而且从不进行快照或备份,因为它可以从AMI自动恢复),有一个单独的数据卷包含实际的mongodb。mongodb卷是快照的,并且在S3上存储转储。快照是创建备份的一种有效方式(因为您只存储增量更改),但您无法将它们转移到EC2区域之外,而S3上的tarball可以轻松地复制到任何地方。

最新更新