大规模数据挖掘：Web与网络分析

需积分: 10 141 浏览量更新于2024-07-20 收藏 2.85MB PDF 举报

"《大规模数据挖掘》是由Anand Rajaraman、Jure Leskovec和Jeffrey D. Ullman合著的一本书，三位作者均来自斯坦福大学。这本书源于他们在斯坦福大学开设的高级研究生课程CS345A，原名为“Web Mining”，尽管起初是为研究生设计，但其内容逐渐被广泛接受，对高级本科生也具有吸引力。随着Jure Leskovec加入斯坦福教职团队，他们对课程进行了重大整合，引入了新的网络分析课程CS224W，并对CS345A进行升级，改名为CS246。本书的核心关注点在于大规模数据挖掘，即处理的数据量巨大到无法一次性存入计算机内存。由于其侧重于大数据处理，书中的许多示例都围绕互联网以及从网络中提取的信息。它涵盖了如何在海量数据中发现模式、关联、趋势和异常行为的技术，这些技术对于理解当今数字化世界中的复杂现象至关重要。书中包含的内容覆盖了三个相关的课程：Web Mining、网络分析和大型数据挖掘项目课程CS341。在内容上，读者可以期待学习到诸如数据采集、数据预处理、分布式计算、机器学习算法（如聚类、分类、关联规则学习等）、图算法在社交网络分析中的应用、文本挖掘和自然语言处理等核心概念。此外，书中还会涉及如何处理实时流数据、如何处理隐私和安全问题，以及如何将数据挖掘成果转化为实际业务策略。《大规模数据挖掘》不仅是一本理论教材，还提供了实践指导，包括案例研究和项目实战，旨在帮助读者掌握处理和解析大规模数据集的实用技能。这是一本在大数据时代背景下，数据科学家、工程师和研究人员不可或缺的参考书籍，它强调的是数据驱动决策和洞察力的挖掘，对于理解和应对当今信息爆炸时代的数据挑战具有重要意义。"

剩余126页未读，继续阅读

geekking

粉丝: 4

大规模数据挖掘：Web与网络分析

大数据挖掘：Stanford大学 Mining of Massive Datasets 教材概览

大规模数据挖掘：Anand.Rajaraman《Mining of Massive Datasets》精华解读

《Mining of Massive Datasets》：大数据挖掘算法与应用

mining of massive datasets

Mining of massive datasets

大数据挖掘：斯坦福大学教材深度解读

大规模数据挖掘：斯坦福大学教材第二版

【大数据课设】p105出租车数据可视化分析-大数据-实训大作业.zip

TypeScript 入门教程

人脸识别_课堂考勤_OpenCV_服务端系统_1741777828.zip

最新资源