没有合适的资源?快使用搜索试试~ 我知道了~
首页大数据离线分析设计和开发
大数据离线分析设计和开发

主要是涉及大数据离线分析设计,从开发环境,以及离线分析过程进行讲述,整个流程比较详细,可供学习和参考。
资源详情
资源评论
资源推荐

环境
环境:hadoop cdh3-u6、jdk6
硬件:ubuntu-12.04
工具:mysql、oozie
离线分析
基于离线分析系统的基础上完成主要的业务报表系统的开发。大数据时代,基本上不
可能通过直接在数据库写几个 SQL 语句来跑报表的方式来生成系统业务报表。
1. 日志收集
提前分析需要准备的业务报表的统计指标,在编写组件代码的时候,进行代码层面的
映射,由各个组件代码完成关键指标的数据收集工作(即结构化日志收集)。
图 1 结构化日志收集原理
2. 分析流程
HDFS 上的结构化日志作为分析数据来源,针对每个账号设计一个用户属性模型和一个


















安全验证
文档复制为VIP权益,开通VIP直接复制

评论1