大数据环境下的BI演进与新特性
3星 · 超过75%的资源 需积分: 0 192 浏览量
更新于2024-07-29
收藏 1.96MB PDF 举报
"谢超在CSDN大数据应用大会上分享了关于大数据环境下商业智能(BI)的新特性和挑战。报告探讨了传统分析方法在面对大数据时的局限性,以及如何通过新的BI解决方案来满足大数据的四个V:体积(Volume)、多样(Variety)、速度(Velocity)和价值(Value)。"
在大数据背景下,传统的BI方法如日志采集、Hadoop、Hive和OLAP等已经无法有效地处理大规模、多类型和快速变化的数据。例如,用户行为分析,不仅涉及结构化的访问信息,还可能包括半结构化和非结构化的数据如信息发表、图像和音频。这些数据的特性包括:大到必须分布式存储,数据质量问题,不统一的数据格式,以及需要处理大量的结构化、半结构化和非结构化数据。
为了应对这些挑战,BI的新特性体现在以下几个方面:
1. **计算分层**:引入流计算、块计算和全局计算,以处理不同速度和规模的数据。例如,流计算用于实时分析,块计算处理批量数据,而全局计算则整合这两种方式。
2. **快速分析**:通过将数据常驻在内存中,提高分析速度,同时通过冗余维度减少查询延迟。
3. **业务人员易用性**:提供更友好的命令接口,让非技术人员也能轻松进行数据分析。
4. **灵活的编程框架**:支持不同类型的计算需求,比如DRPC、MapReduce和SQL,以适应不断变化的计算需求。
5. **完整的BI分析架构**:包括实时层、批处理层以及全局数据的整合,确保了从数据采集到结果输出的全链条效率。
6. **实时层与批处理层的结合**:实时层负责增量补充,批处理层则进行深度分析,如Twitter的例子所示,其流计算框架Storm可以实现快速的ETL和事件驱动的报警。
7. **开源技术的应用**:如Twitter的Storm,为实时流处理提供了强大的工具,可以解决简单计数等实时计算问题,但可能不适合复杂的数据去重统计。
大数据下的BI新特性着重于提升处理速度、增强灵活性、简化用户操作,并且充分利用各种数据类型,以挖掘大数据的价值。这要求BI系统具备更强的适应性、可扩展性和实时性,以应对大数据的挑战。
2021-04-28 上传
2021-11-26 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情