万师傅大数据选型:从Hadoop到MaxCompute的转型之路

需积分: 10 3 下载量 141 浏览量 更新于2024-07-17 收藏 5.41MB PPTX 举报
"万师傅大数据负责人王昕岩在2017广州云栖大会上分享了其公司在大数据选型过程中从传统数据库向阿里云MaxCompute转变的心路历程,强调了大数据不仅是数据分析,更是时代变革的标志。他积极参与阿里云产品的优化与社区支持,利用MaxCompute实现数据的图形化和实时离线处理,建立了完善的数据运营平台,优化成本并建立诚信体系。" 王昕岩在分享中指出,大数据不仅是关于数据的分析和处理,它象征着一个新时代的到来。作为阿里云MVP,他在大数据开发套件和ARMS等产品上提出了诸多优化建议,致力于提升产品体验。同时,他在数加Dataworks使用交流群中活跃,帮助其他用户解决问题,防止因误解产品而导致的选型失误。 在万师傅,王昕岩带领团队利用大数据技术改造传统服务行业,构建了一个涵盖多种家居售后服务的平台。他们通过MaxCompute实现了数据的图形化展示,从实时到离线的无缝转换,以及从传统数据库到大数据架构的升级。在从自建Hadoop迁移到阿里云的过程中,他们最终选择了MaxCompute,因为它提供了无可替代的可视化调度和完善的生态圈,而且成本低廉。 MaxCompute的优势在于其强大的数据处理能力,配合QuickBI、表格存储、OSS、日志服务和OpenSearch等阿里云产品,可以实现成本的有效优化。王昕岩分享了一些最佳实践,如通过合理的表分区设计、SQL关键词优化和数据仓库模型来平衡性能和成本。他还给出了避免SELECT*、减少FullOuterJoin、避免不必要的UnionAll以及在外层统一GroupBy等SQL优化策略,以提高查询效率。 总结来说,王昕岩的经验分享揭示了企业在大数据选型中应考虑的关键因素,包括技术的先进性、生态的完整性、成本效益和用户体验。通过将MaxCompute融入大数据战略,万师傅成功地利用数据推动了业务发展和公司的进步。