根据1.第一阶段:数据清洗 将元数据从hdfs中提取并清洗,导入Hbase数据库。 清洗后的数据只保留有用字段 2.第二阶段:数据分析 从Hbase中提取数据,使用Mapreduce进行数据分析,统计销量前十名 3.第三阶段:数据展现 统计出的结果使用图形化的方式进行展现 4.第四阶段:拓展 重复以上的方法进行多层面的统计得出更多的结果 整理成四天的计划表
时间: 2023-02-10 07:18:31 浏览: 58
第一天的计划:从hdfs中提取元数据并清洗,将清洗后的数据导入Hbase数据库。第二天的计划:从Hbase中提取数据并使用Mapreduce进行数据分析,统计销量前十名。第三天的计划:将统计出的结果使用图形化的方式进行展现。第四天的计划:重复以上的方法进行多层面的统计,得出更多的结果。
阅读全文