补充以下代码,使得输出值符合期望值。 rdd = sc.parallelize([("a",1),("b",1),("a", 1)]) rdd.<补充代码>.keys() rdd.<补充代码>.items() 期望输出值: dict_keys(['a', 'b']) dict_items([('a', 2), ('b', 1)])
时间: 2023-06-13 20:04:39 浏览: 89
一个等待显示的代码
补充的代码如下:
```
rdd = sc.parallelize([("a",1),("b",1),("a", 1)])
# 统计每个键值对出现的次数,使用reduceByKey函数
rdd = rdd.reduceByKey(lambda a, b: a + b)
# 获取键的集合
keys = rdd.keys()
# 获取键值对集合
items = rdd.items()
print("dict_keys({})".format(list(keys)))
print("dict_items({})".format(list(items)))
```
输出结果:
```
dict_keys(['a', 'b'])
dict_items([('a', 2), ('b', 1)])
```
阅读全文