spark用scala获取单词个数最多的行的单词个数
时间: 2023-05-19 08:04:20 浏览: 132
Spark Scala简单 统计单词个数
3星 · 编辑精心推荐
可以使用以下代码获取单词个数最多的行的单词个数:
```
val textFile = sc.textFile("hdfs://...")
val maxWords = textFile.map(line => line.split(" ").size).reduce((a, b) => if (a > b) a else b)
```
其中,`textFile` 是一个 RDD,代表文本文件中的每一行。`map` 函数将每一行转换为单词个数,`reduce` 函数找到最大值。
阅读全文