根据以下要求, 完成相关数据处理？目前有如下数据集(上传到HDFS的 /data/data.txt): 张三-北京李四-上海王五-北京赵六-广州田七-深圳周八-武汉李九-杭州最终结果转换为: [(张三,北京),(李四,上海),(王五,北京),(赵六,广州),(田七,深圳),(周八,武汉),(李九,杭州)]

你可以使用Python中的字符串分割和列表推导式来完成这个数据处理任务。下面是一个示例代码： ```python # 读取数据集文件 with open('/data/data.txt', 'r') as file: data = file.read() # 分割数据集字符串并生成最终结果列表 result = [(name, city) for name, city in [item.split('-') for item in data.split()]] print(result) ``` 运行以上代码，你将得到如下所示的最终结果： ```python [('张三', '北京'), ('李四', '上海'), ('王五', '北京'), ('赵六', '广州'), ('田七', '深圳'), ('周八', '武汉'), ('李九', '杭州')] ``` 这样，数据集中的每个条目都被转换为一个元组，包含人名和城市信息。

阅读全文

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通