根据1.第一阶段:数据清洗 将元数据从hdfs中提取并清洗,导入Hbase数据库。 清洗后的数据只保留有用字段 2.第二阶段:数据分析 从Hbase中提取数据,使用Mapreduce进行数据分析,统计销量前十名 3.第三阶段:数据展现 统计出的结果使用图形化的方式进行展现 4.第四阶段:拓展 重复以上的方法进行多层面的统计得出更多的结果 整理成六天的计划表
时间: 2023-02-10 13:18:31 浏览: 114
数据处理第一步:清洗和提炼
5星 · 资源好评率100%
第一天:从HDFS中提取元数据并进行清洗,只保留有用字段。
第二天:将清洗后的数据导入Hbase数据库。
第三天:使用Mapreduce从Hbase中提取数据,并进行数据分析,统计销量前十名。
第四天:使用图形化方式展现统计出的结果。
第五天:重复以上方法进行多层面的统计,得出更多的结果。
第六天:整理计划表。
阅读全文