使用 Hive 进行 Wordcount 词频统计,下列说法正确的是 A. aselect word , count (*) from ( select explode ( split ( line ,'')) as word from docs ) w group by word ; B .select word , count (*) from ( select explode ( split ( line ,'')) as word from docs ) w group by line ; C. select word , line , count (*) from ( select explode ( split ( line ,'')) as word from docs ) w group by word ; D. 以上都不对
时间: 2024-03-25 12:38:23 浏览: 52
选项 A 是正确的。Hive 中的 Wordcount 统计可以使用 explode 函数和 split 函数来实现。具体来说,可以使用以下语句来进行 Wordcount 统计:
```
select word, count(*) from
(select explode(split(line, ' ')) as word from docs) w
group by word;
```
其中,split 函数把每行文本按照空格分隔成单词数组,explode 函数把每行的单词数组展开成多行数据,然后再按照单词分组,统计每个单词的个数。
阅读全文