spark add 实现词频统计
时间: 2023-05-19 19:03:47 浏览: 117
可以使用以下代码实现:
```scala
import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
object WordCount {
def main(args: Array[String]) {
val conf = new SparkConf().setAppName("WordCount")
val sc = new SparkContext(conf)
val textFile = sc.textFile(args(0))
val counts = textFile.flatMap(line => line.split(" "))
.map(word => (word, 1))
.reduceByKey(_ + _)
counts.saveAsTextFile(args(1))
}
}
```
其中,`args(0)` 是输入文件的路径,`args(1)` 是输出文件的路径。
阅读全文