大数据:算法、分析与应用

需积分: 9 96 下载量 140 浏览量 更新于2024-07-20 3 收藏 51.79MB PDF 举报
"《大数据:算法、分析与应用》是一本深入探讨大数据处理、分析和应用的专业书籍,由领域内的专家合著。本书分为五个主要部分,涵盖了大数据管理、处理、流技术与算法、隐私保护以及应用实例。通过介绍最新的研究成果和成就,书中揭示了在大数据环境下如何利用先进的算法和分析策略来挖掘数据中的模式,并以此提升竞争优势。" 在第一部分“大数据管理”中,作者讨论了大数据管理的相关研究问题,包括索引构建和可扩展性方面,以应对海量数据的存储和检索挑战。 第二部分“大数据处理”聚焦于在各种资源密集型计算环境中处理大数据的问题,包括使用亚马逊的Hadoop服务进行增量数据处理的可扩展性和成本评估。 第三部分“大数据流技术与算法”探讨了流环境下的大数据管理和挖掘的研究问题,为实时数据处理提供了新的思路和技术。 第四部分“大数据隐私”关注保护大数据隐私的模型、技术和算法,为在保障隐私的同时进行数据分析提供了理论基础。 第五部分“大数据应用”展示了大数据在金融、多媒体工具、生物识别和卫星数据处理等多个领域的实际应用,展示了大数据技术的广泛影响力。 书中涵盖的主题包括但不限于:大规模数据集的相似性搜索的奇异值分解、聚类和索引方法;基于遗传算法的多序列比对和聚类;高性能大数据处理的方法和挑战;大数据科学的艺术——调度;MapReduce框架中的时间-空间调度;面向多线程系统的图数据库引擎;大规模网络社区检测;使软件开发者社区对大数据透明化的方法;大数据流计算的关键技术;多核架构上的大数据流处理算法;个人大数据集成和组织的统一框架;在线处理位置流的大规模轨迹数据管理;大数据的个人数据保护;OLAP(在线分析处理)中的隐私保护大数据管理;以及特定领域的应用案例,如金融大数据、语义驱动的异构多媒体大数据检索、大规模多媒体分析和检索的话题建模、基于英特尔Xeon Phi的大数据生物识别处理(以虹膜匹配为例)以及大型卫星数据的存储、管理和分析等。 这本书不仅报告了大数据领域的前沿研究,还为读者提供了进一步探索这个充满挑战的科学领域的基础知识,对于下一代数据库、数据仓库、数据挖掘和云计算研究具有指导意义。同时,它还探讨了不同领域内的相关应用,涵盖了媒体/数据通信、弹性媒体/数据存储、跨网络媒体/数据融合和SaaS(软件即服务)等技术。