大数据环境下的BI演进与新特性

"谢超在CSDN大数据应用大会上分享了关于大数据环境下商业智能(BI)的新特性和挑战。报告探讨了传统分析方法在面对大数据时的局限性,以及如何通过新的BI解决方案来满足大数据的四个V:体积(Volume)、多样(Variety)、速度(Velocity)和价值(Value)。"
在大数据背景下,传统的BI方法如日志采集、Hadoop、Hive和OLAP等已经无法有效地处理大规模、多类型和快速变化的数据。例如,用户行为分析,不仅涉及结构化的访问信息,还可能包括半结构化和非结构化的数据如信息发表、图像和音频。这些数据的特性包括:大到必须分布式存储,数据质量问题,不统一的数据格式,以及需要处理大量的结构化、半结构化和非结构化数据。
为了应对这些挑战,BI的新特性体现在以下几个方面:
1. **计算分层**:引入流计算、块计算和全局计算,以处理不同速度和规模的数据。例如,流计算用于实时分析,块计算处理批量数据,而全局计算则整合这两种方式。
2. **快速分析**:通过将数据常驻在内存中,提高分析速度,同时通过冗余维度减少查询延迟。
3. **业务人员易用性**:提供更友好的命令接口,让非技术人员也能轻松进行数据分析。
4. **灵活的编程框架**:支持不同类型的计算需求,比如DRPC、MapReduce和SQL,以适应不断变化的计算需求。
5. **完整的BI分析架构**:包括实时层、批处理层以及全局数据的整合,确保了从数据采集到结果输出的全链条效率。
6. **实时层与批处理层的结合**:实时层负责增量补充,批处理层则进行深度分析,如Twitter的例子所示,其流计算框架Storm可以实现快速的ETL和事件驱动的报警。
7. **开源技术的应用**:如Twitter的Storm,为实时流处理提供了强大的工具,可以解决简单计数等实时计算问题,但可能不适合复杂的数据去重统计。
大数据下的BI新特性着重于提升处理速度、增强灵活性、简化用户操作,并且充分利用各种数据类型,以挖掘大数据的价值。这要求BI系统具备更强的适应性、可扩展性和实时性,以应对大数据的挑战。
相关推荐










jakensonwangjh
- 粉丝: 0
最新资源
- 纠正东京2020地图错误的Fix Map-crx插件
- iTunes 12.3.2.35版本发布 支持历史版APP Store管理
- 探索Project-38-main中的JavaScript创新
- 易语言源码解析:高效时间格式化技巧
- 基于AVPlayer的iOS视频音频播放器功能详解
- C#基于DirectX的录音程序开发
- H5客户端图片压缩技术与应用
- HTML技术实践:wlcdt-assignment5项目分析
- 惠灵顿河流水位监测工具 - Wellington Paddler-crx插件
- Rpush插件集成Sentry日志监控功能
- 仿新闻应用顶部滑动的iOS滑动视图框架
- Spring Boot与MySQL数据库连接操作指南
- Netty同步等待数据返回的实现与代码示例
- Node.js概念挑战:Bootcamp GoStack课程解析
- Odoo 13.0企业版安装包下载
- STM32MP157基于FreeRTOS的队列操作实战教程