FreeWheel系统背后的高性能与容错架构设计

需积分: 10 4 下载量 183 浏览量 更新于2024-09-17 收藏 456KB PDF 举报
"《Hadoop取舍之间》是一份来自FreeWheel公司两位专家——Co-Founder及CTO Diane Yu和核心系统技术总监王迪的实践分享,他们在2009年的FreeWheelMRM系统后台项目的架构设计与优化案例中,深入探讨了高性能、高流量互联网应用架构的关键原则。这份报告主要围绕以下几个方面展开: 1. 设计考虑失败:强调软件没有无bug的,硬件也不存在绝对可靠,因此在设计时必须考虑到故障的可能性。这意味着系统需要具备容错性,通过数据分区(如负载均衡,确保任务均匀分布)、减少依赖性和冗余来降低单点故障的风险。 2. 监控至关重要:从客户和容量两个角度进行全方位监控,确保系统的稳定性和可扩展性。这包括了对服务性能指标的关注,例如广告投放服务的高可用性(Uptime达到99.99%,每月停机时间不超过4分钟)。 3. KISS原则:即保持简单(Keep It Simple, Stupid)。随着需求和技术的不断变化,系统需易于维护和进化。复杂的设计通常意味着更多的代码和更高的维护成本,因此提倡简洁而有效的解决方案。 4. Just in Time设计:追求适度设计,避免过度设计,认识到完美设计并不存在,应以最简化的形式启动项目,然后根据实际运行情况逐步优化和重构。在重构时,建议分模块进行,而非整体重写。 5. 实现高性能策略:除了上述原则,报告还涉及具体的性能提升措施,如负载均衡技术、多路转发的Web服务、前端应用服务器的failover设计,以及利用多线程和自动化工具如WatchDog和SNMP来监控和管理服务。 这份文档为读者提供了一套实用的指导,特别是在面临大规模数据处理和高并发场景下,如何权衡取舍,构建健壮且高效的Hadoop系统架构。通过FreeWheel的成功案例,读者可以学习到在实际工作中如何应对挑战,提升系统的稳定性、性能和灵活性。"

结合下面hive元数据信息,生成hive建表语句,并且加上comment,注意day是分区 dwd_weibo_crawl NULL appmarket_appinfo GN线应用市场 2021-01-07 15:07:29 apk 应用包名 string day string入库日期 org.apache.hadoop.hive.ql.io.orc.OrcSerde serialization.format 1 hdfs://DSbigdata/hiveDW/dwd_exten_crawl/appmarket_appinfo org.apache.hadoop.hive.ql.io.orc.OrcInputFormat org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat dwd_weibo_crawl NULL appmarket_appinfo GN线应用市场 2021-01-07 15:07:29 app_name 应用名称 string day string 入库日期 org.apache.hadoop.hive.ql.io.orc.OrcSerde serialization.format 1 hdfs://DSbigdata/hiveDW/dwd_exten_crawl/appmarket_appinfo org.apache.hadoop.hive.ql.io.orc.OrcInputFormat org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat dwd_weibo_crawl NULL appmarket_appinfo GN线应用市场 2021-01-07 15:07:29 app_url 平台详情页链接 string day string入库日期 org.apache.hadoop.hive.ql.io.orc.OrcSerde serialization.format 1 hdfs://DSbigdata/hiveDW/dwd_exten_crawl/appmarket_appinfo org.apache.hadoop.hive.ql.io.orc.OrcInputFormat org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat dwd_weibo_crawl NULL appmarket_appinfo GN线应用市场 2021-01-07 15:07:29 cate 应用所属分类 string day string入库日期 org.apache.hadoop.hive.ql.io.orc.OrcSerde serialization.format 1 hdfs://DSbigdata/hiveDW/dwd_exten_crawl/appmarket_appinfo org.apache.hadoop.hive.ql.io.orc.OrcInputFormat org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat dwd_weibo_crawl NULL appmarket_appinfo GN线应用市场 2021-01-07 15:07:29 other 其他 string day string 入库日期 org.apache.hadoop.hive.ql.io.orc.OrcSerde serialization.format 1 hdfs://DSbigdata/hiveDW/dwd_exten_crawl/appmarket_appinfo org.apache.hadoop.hive.ql.io.orc.OrcInputFormat org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat dwd_weibo_crawl NULL appmarket_appinfo GN线应用市场 2021-01-07 15:07:29 region 平台名称 string day stri

2023-06-10 上传