大规模数据挖掘:斯坦福经典教程
需积分: 10 95 浏览量
更新于2024-07-22
收藏 2.91MB PDF 举报
《大规模数据集挖掘》(Mining Massive Data Sets)是一本由斯坦福大学的Jure Leskovec、Anand Rajaraman和Jeffrey D. Ullman合著的经典教材。这本书源自他们多年为斯坦福大学高级研究生课程"Web Mining"(后改为CS224W,网络分析)所开发的材料,虽然最初主要针对研究生,但其内容逐渐普及,对高年级本科生也极具吸引力。当Leskovec加入斯坦福教职队伍后,他进一步组织并扩展了课程内容,不仅在CS224W中加入了网络分析,还对原来的CS345A进行了修订,改名为CS246。此外,三位作者还开设了一门大规模数据挖掘项目课程CS341,这些课程的内容都被整合进了本书。
该书的核心关注点在于大规模数据挖掘,即处理的数据规模巨大到无法一次性加载到常规内存中。由于侧重于大数据,书中提供了大量关于互联网或大规模数据源的实例,这些例子旨在展示如何在海量数据背景下进行有效的数据挖掘和分析。书中涵盖的主题包括数据挖掘的基本概念、算法和技术,如关联规则学习、聚类、分类、异常检测以及网络分析方法等,这些都是在处理大数据时必不可少的工具。
书中深入探讨了如何利用分布式系统和云计算技术来处理大规模数据,例如Hadoop MapReduce框架的应用,以及如何设计和优化数据流处理算法。此外,作者还强调了数据隐私和安全问题,在大数据时代如何保护个人信息和商业秘密。
《大规模数据集挖掘》不仅仅是一本理论教材,它还包含了丰富的实践案例和实战项目,读者可以通过解决实际问题来理解和掌握理论知识。它适合那些希望在这个快速发展的领域中寻求深入理解的专业人士,无论是计算机科学、数据科学、统计学还是商业分析领域的学生和研究者,都能从中受益匪浅。
这是一本在当今大数据时代不可或缺的参考书籍,它帮助读者掌握了处理和从海量数据中提取有价值信息的关键技能,是数据驱动决策和创新的重要指南。
2017-03-07 上传
2021-03-20 上传
2021-06-11 上传
2009-08-14 上传
2018-03-20 上传
MATLAB Legends and Big Data Analytics: Applying Legends in Visualizing Massive Datasets, Gaining ...
点击了解资源详情
点击了解资源详情
jixieniao01
- 粉丝: 0
- 资源: 12
最新资源
- spark-study
- item_lister
- MAKEDATATIP:允许以编程方式将数据提示添加到任何有效的图形对象。-matlab开发
- [图片动画]Coppermine Photo Gallery v1.4.19 多国语言版_cpg1419.rar
- 锻炼追踪器
- Not today, Jeff-crx插件
- 参考资料-制冷系统气密性试验记录 (2).zip
- zmd:怎么的,假装自己是 markdown parser
- MATLAB7.8-image-process,matlab多旅行商问题源码,matlab源码下载
- cp-live-gmail-clone
- vue-reading:Vue源码阅读
- 简单清爽手机网站模板企业网站模板手机触屏版(单页)_网站开发模板含源代码(css+html+js+图样).zip
- pwr_kml_3d:从 [Time,Lat,Lon] 和 [Time,Depth/Altitude] 矩阵创建 3-D google earth KMZ 文件-matlab开发
- Brexit Stones-crx插件
- jest-json:玩笑匹配器可使用JSON字符串
- program-digital-clock,ide看c语言源码,c语言