现有1-1.txt、1-2.txt和1-3.txt三个文件，文件内容是由空格分割的若干个数字组成，其中一个文件的部分内容如图所示。文件目录为D:\编程题1\1-1.txt、D:\编程题1\1-2.txt和D:\编程题1\1-3.txt。现要求统计出各个文件的平均数，输出统计结果。

您可以使用以下代码来读取三个文件（1-1.txt、1-2.txt和1-3.txt），计算各个文件的平均数，并输出统计结果： ```python from pyspark import SparkContext # 创建SparkContext对象 sc = SparkContext("local", "FileAverage") # 读取三个文件并创建RDD file_paths = ["D:\编程题1\1-1.txt", "D:\编程题1\1-2.txt", "D:\编程题1\1-3.txt"] rdd = sc.textFile(','.join(file_paths)) # 计算各个文件的平均数 result_rdd = rdd.flatMap(lambda line: line.split(" ")) \ .map(lambda num: (num, 1)) \ .reduceByKey(lambda x, y: x + y) \ .mapValues(lambda count: count / len(file_paths)) # 输出统计结果 result_rdd.collect() ``` 请注意，您需要将文件路径`D:\编程题1\1-1.txt`、`D:\编程题1\1-2.txt`和`D:\编程题1\1-3.txt`修改为正确的文件路径，并确保Spark环境已正确设置。此代码将返回一个包含统计结果的RDD对象，您可以使用`.collect()`方法将其转换为列表并打印出来。

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通

最新推荐

mipi_CSI-2_specification_v3-0_diff_v2-1.pdf

802.1as协议-2020版本

802.1Qav-2009.pdf

IEEE 802.3ch-2020 /10GBase T1标准

2020 CSP-J1 CSP-S1答案解析及总结(C)-2020.10.12.pdf

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

spring添加xml配置文件

JSBSim Reference Manual