MapReduce 支持的部分数据挖掘算法
时间: 2024-06-01 07:09:00 浏览: 100
Mining-Frequent-Pattern-from-Search-History:《大数据挖掘技术》@复旦 课程项目,试图从搜狗实验室用户查询日志数据(2008)中找出搜索记录中有较高支持度关键词的频繁二项集。在实现层面上,我搭建了一个由五台服务器组成的微型 Hadoop 集群,并且用 Python 实现了 Parallel FP-Growth 算法中的三个 MapReduce 过程
MapReduce 是一种用于大规模数据处理的编程模型,它可以支持许多数据挖掘算法的实现。以下是一些 MapReduce 支持的部分数据挖掘算法:
1. K-Means 聚类算法
2. Apriori 关联规则挖掘算法
3. PageRank 算法
4. 决策树算法
5. 随机森林算法
6. 支持向量机算法
7. Naive Bayes 分类算法
8. Logistic 回归算法
这些算法都可以通过 MapReduce 编程模型进行实现,以便在大规模数据集上进行高效的并行处理。
阅读全文