请使用pandas读取数据集challenge.csv请提取该数据集的字段名称,将结果存为cols,并将cols存为列表格式请获取给定数据的字段和样本数量,将结果分别存为col_num和sam_num请获取该数据集的前五行记录,将最后的DataFrame存为five_data请删除该数据集中的字段PassengerId, Ticket, 将最终的DataFrame存为new_data,并查看new_data的最后3行数据,保存到three_data打印变量cols,col_num,sam_num,five_data的前三列,three_data的列名请针对字段Embarked, 使用该字段的众数对其缺失值进行填充,该操作基于原数据集,并打印填充部分对应的Embarked请针对字段Age, 使用该字段的均值对其缺失值进行填充,该操作基于原数据集,并打印填充部分前三行对应的Age基于原数据集,由于字段Cabin包含的缺失值过多,请删除该字段,并用info展示数据集的详细信息【输入形式】【输出形式】【样例输入】【样例输出】【样例说明】【评分标准】import pandas as pdimport numpy as npdef main():
时间: 2023-12-06 19:43:55 浏览: 140
数据集不是完整的,目的是熟练使用Pandas - 两个数据集 >`calendar.csv` >`listings.csv`
import pandas as pd
import numpy as np
# 读取数据集
data = pd.read_csv('challenge.csv')
# 提取字段名称
cols = list(data.columns)
# 获取数据集的字段和样本数量
col_num = len(cols)
sam_num = len(data)
# 获取前五行记录
five_data = data.head()
# 删除指定字段
new_data = data.drop(['PassengerId', 'Ticket', 'Cabin'], axis=1)
# 查看删除后的数据集最后3行
three_data = new_data.tail(3)
# 打印结果
print(cols)
print(col_num)
print(sam_num)
print(five_data.iloc[:, :3])
print(three_data.columns)
# 使用字段Embarked的众数对其缺失值进行填充
mode = new_data['Embarked'].mode()[0]
new_data['Embarked'].fillna(mode, inplace=True)
print(new_data.loc[new_data['Embarked'].isnull(), 'Embarked'])
# 使用字段Age的均值对其缺失值进行填充
mean = new_data['Age'].mean()
new_data['Age'].fillna(mean, inplace=True)
print(new_data.loc[new_data['Age'].isnull()].head(3))
# 展示数据集信息
new_data.info()
阅读全文