首页spark add 实现词频统计

spark add 实现词频统计

时间: 2023-05-19 09:03:47 浏览: 119

可以使用以下代码实现： ```scala import org.apache.spark.SparkConf import org.apache.spark.SparkContext object WordCount { def main(args: Array[String]) { val conf = new SparkConf().setAppName("WordCount") val sc = new SparkContext(conf) val textFile = sc.textFile(args(0)) val counts = textFile.flatMap(line => line.split(" ")) .map(word => (word, 1)) .reduceByKey(_ + _) counts.saveAsTextFile(args(1)) } } ``` 其中，`args(0)` 是输入文件的路径，`args(1)` 是输出文件的路径。

阅读全文