AWS良好架构框架：构建高可用性系统的关键

4星 · 超过85%的资源需积分: 9 145 浏览量更新于2024-07-18 2 收藏 1.2MB PDF 举报

"AWS良好架构框架的可靠性支柱是AWS提供的一套指导原则，旨在帮助用户在AWS环境中设计、部署和维护高可用性的系统。该框架包括安全性、可靠性、性能效率、成本优化和卓越操作五个支柱，本文件主要关注的是可靠性支柱。" 在AWS的良好架构框架中，可靠性是一个至关重要的方面，它涉及到设计原则、基础架构、变更管理、监控、故障管理和数据持久性等多个环节。以下是这些环节的详细解释： 1. 设计原则：构建可靠的系统需要遵循一系列设计原则，如冗余、隔离、自动化和灵活性。冗余意味着在系统中部署多个组件以避免单点故障；隔离确保故障不会扩散到整个系统；自动化则能减少人为错误和提高响应速度；灵活性则意味着系统应能适应不断变化的需求。 2. 定义：可靠性是系统能够持续提供预期服务的能力，即使在面临硬件故障、软件错误或网络问题时也能保持服务的可用性。 3. 基础：构建可靠系统的基础包括使用容错架构，例如采用多区域部署，以防止地理位置相关的故障影响服务。此外，使用自动伸缩组和负载均衡器可以确保在需求变化时自动调整资源。 4. 限制管理：理解并管理系统的容量限制是保证可靠性的关键。这包括监控资源使用情况，预估未来需求，并设置适当的阈值以防止过载。 5. 规划网络拓扑结构：网络设计应考虑故障隔离和流量路由策略，以确保即使部分网络出现问题，服务仍然可用。 6. 变更管理：实施严格的变更管理流程，包括计划、审批、测试和回滚策略，可以降低变更导致的服务中断风险。 7. 按需变更：使用自动化工具进行配置管理和部署，确保变更的快速、一致和安全。 8. 监控：持续监控系统状态，包括性能指标、日志和安全事件，以便及时发现并处理问题。 9. 变更执行：遵循最佳实践执行变更，如使用蓝绿部署或金丝雀发布，以最小化对生产环境的影响。 10. 故障管理：建立有效的故障响应机制，包括快速识别故障、隔离故障源、回滚变更和修复问题。 11. 数据持久性：确保数据的持久性和一致性，通过备份和复制策略防止数据丢失。 12. 承受组件故障：设计系统以容忍单个组件的失败，通过分布式和冗余来确保服务的连续性。 13. 恢复规划：制定详尽的灾难恢复计划，包括备份恢复、业务连续性和数据恢复策略。 14. 结论：遵循这些最佳实践，开发者和架构师可以在AWS上构建出高度可靠的系统，提高业务的韧性和用户满意度。 15. 贡献者与扩展阅读：这份白皮书的编写者和更多相关资源的链接，供进一步学习和研究。 AWS良好架构框架的可靠性支柱提供了全面的指导，帮助用户构建、运行和优化在AWS上的应用程序，确保它们能够在各种情况下持续稳定地提供服务。通过理解和应用这些原则，用户可以大大提高其云架构的可靠性，从而增强业务的连续性和用户信任。

Amazon Web Services –AWS 良好架构框架可靠性支柱

2 / 23

 测试恢复规程: 在本地环境中，测试工作通常用于证明系统在特定情况

下的正常运作能力。测试通常不会被用于验证恢复策略。但在云环境下，

您可以测试系统在遭遇故障时的具体表现，并借此验证您的恢复规程。

您可以利用自动化手段模拟不同故障或重新构建造成早期故障的具体场

景。根据由此表现出的问题，您可以在实际故障发生之前作出测试与纠

正，并借此降低以往从未测试过的组件可能引发的潜在危害。

 自动实现故障恢复: 通过监控系统内的各项关键性能指标（简称 KPI），

您可以在触及阈值时触发自动响应操作。这种自动化方案中可包含故障

通知与追踪机制，以及用于缓解或修复故障问题的恢复流程。凭借着更

为复杂的自动化方案，您甚至可以在故障实际发生前作出预测并加以修

复。

 横向扩展以提升整体系统可用性: 利用多种小型资源取代单一大型资源，

借此降低单一故障对于整体系统产生的影响。跨越多种小型资源的分布

式请求将能够确保其不致共同面对同一故障点。

 不再依靠猜测确定容量需求：内部系统当中的一大常见故障根源在于资

源饱和，即系统请求的资源超过该系统的资源供给能力（拒绝服务攻击

通常正是以此为目标）。在云环境当中，您可以监控系统资源的需求与利

用率，并通过自动化方式添加或者移除部分资源以维持其最优水平，从

而在无需过度或者过低配置的情况下满足实际需求。

 自动管理变更: 基础设施内的变更应以自动化方式实现。需要加以管理

的一切变更皆应被纳入自动化变更范畴之内。

定义

云环境下的可靠性保护包含以下三项最佳实践：

1. 基础

2. 变更管理

3. 故障管理

为了实现这种可靠性，系统必须拥有经过良好规划的基础且将监控机制部署到位，

同时有能力根据需求或者要求处理各项变更。该系统还应在设计当中引入故障检

测与自动化自主修复能力。

剩余26页未读，继续阅读

nightwind81

粉丝: 1
资源: 1

AWS良好架构框架：构建高可用性系统的关键

AWS+良好架构框架+–+成本优化支柱

AWS-良好的架构设计-上

AWS良好架构框架：安全性支柱详解与实践指南

AWS良好架构框架解析：五大支柱与最佳实践

AWS良好架构框架：中文指南

AWS文档 - 框架和方法.zip

AWS Well Architected Framework

aws well arhcitecture ml lens

AWS-CLF-C01-AWS Certified Cloud Practitioner.325Q.pdf

AWS良好架构框架：成本优化策略与最佳实践

最新资源