大数据技术与应用:HPCC平台解决方法

5星 · 超过95%的资源 需积分: 11 63 下载量 41 浏览量 更新于2024-07-20 1 收藏 8.41MB PDF 举报
"《大数据技术与应用》由Borko Furht和Flavio Villanustre合著,是一本深入介绍大数据计算基础概念和解决方案的书籍。该书通过15章的内容分为三个部分:大数据技术、LexisNexis风险解决方案和大数据应用。它涵盖了大数据概念、分析、可视化、学习技术以及HPCC(High Performance Computing Cluster)平台的使用,特别关注了在解决大数据问题中所采用的技术和方法。此外,书中还讨论了网络安全、社会网络分析、埃博拉病毒传播模型、无监督学习和图像分类等实际应用案例。这本书面向研究人员、科学家、程序员、工程师、设计师、开发人员、教育工作者和学生,同时对商业经理、企业家和投资者也有参考价值。" 本书的结构如下: 1. 第一部分“大数据技术”包括: - 第1章介绍了大数据的基本概念,为后续章节奠定了基础。 - 第2章探讨了大数据分析,涉及数据挖掘和处理的关键方法。 - 第3章讲解了迁移学习技术,这是处理大规模数据时的一种有效策略。 - 第4章关注大数据的可视化,展示了如何有效地呈现复杂数据。 - 第5章深入到深度学习技术,阐述其在大数据分析中的作用。 2. 第二部分“LexisNexis风险解决方案”专用于大数据: - 第6章介绍了HPCC/ECL平台,这是一个开源的大数据计算平台,具有高度可扩展性。 - 第7章讲述了大规模自动化链接技术,这是处理大数据计算的关键工具。 - 第8章讨论了在HPCC系统中进行聚合数据分析的方法。 - 第9章提出了适用于大数据的模型,这些模型对于预测和理解数据模式至关重要。 - 第10章介绍了数据密集型超级计算解决方案,揭示了处理海量数据的高级策略。 3. 第三部分“大数据应用”提供了实际案例研究: - 第12章展示了HPCC系统在网络安全分析中的应用,揭示了如何利用大数据来提升网络安全。 - 第13章探讨了社会网络分析,特别是隐藏和复杂的欺诈行为,这在社交媒体时代尤为重要。 - 第14章使用HPCC/KEL系统模拟了埃博拉病毒的传播,展示了大数据在公共卫生领域的潜力。 - 第15章介绍了无监督学习和图像分类在高性能计算集群中的应用,这是人工智能和机器学习领域的重要组成部分。 通过这本书,读者将能够理解和掌握大数据的核心概念和技术,了解如何利用HPCC系统解决实际问题,并能够在各种场景中应用大数据分析。无论是学术研究、工程实践还是商业决策,这本书都能提供丰富的知识和洞察力。