coding: utf-8 import pandas as pd #导入成绩数据 df = pd.read_excel('d: \data \grade.xls',sheet name='gradel') #所有值全为缺失值才删除 df1 = df.dropna(how='al1')#输出df1的前5行 print(df1.head()) #删除至少出现过两个缺失值的行 df1 = df.dropna(thresh=2,axis=0)#输出df1的前10行 print (df1.head (10)) #删除subset中指定的列含有缺失值的行df1 = df.dropna (subset=['exam']) #输出df1的前5行 print (df1.head()) #删除含有缺失值的列 print (df.dropna(axis=1)) #只要有缺失值就删除,并且直接在原数据上进行修改 df1 = df.dropna(how='any',inplace=True) print(df)是否有错
时间: 2024-03-16 22:41:06 浏览: 17
这段代码有一个小错误,即最后一行的 `df1 = df.dropna(how='any',inplace=True)`。`inplace=True` 参数会直接在原 DataFrame 上进行修改,因此不需要再将结果赋值给 `df1`。正确的写法应该是:
```
df.dropna(how='any', inplace=True)
print(df)
```
相关问题
#-- coding: utf-8 -- #计算预测误差 import pandas as pd #参数初始化 file = '../data/predictdata.xls' data = pd.read_excel(file) #计算误差 abs_ = (data[u'预测值'] - data[u'实际值']).abs() mae_ = abs_.mean() # mae rmse_ = ((abs_**2).mean())**0.5 # rmse mape_ = (abs_/data[u'实际值']).mean() # mape print(u'平均绝对误差为:%0.4f,\n均方根误差为:%0.4f,\n平均绝对百分误差为:%0.6f。' %(mae_, rmse_, mape_))加注释
# -- coding: utf-8 --
# 上面这行是为了确保代码中可以使用中文注释和中文字符
# 计算预测误差
import pandas as pd
# 参数初始化
file = '../data/predictdata.xls' # 文件路径
data = pd.read_excel(file) # 读取数据
# 计算误差
abs_ = (data[u'预测值'] - data[u'实际值']).abs()
mae_ = abs_.mean() # 平均绝对误差
rmse_ = ((abs_**2).mean())**0.5 # 均方根误差
mape_ = (abs_/data[u'实际值']).mean() # 平均绝对百分误差
# 输出结果
print(u'平均绝对误差为:%0.4f,\n均方根误差为:%0.4f,\n平均绝对百分误差为:%0.6f。' %(mae_, rmse_, mape_)) # 使用中文字符来提高代码可读性,输出各项误差的值,保留4位小数和6位小数。
# -*-coding:utf-8-*- import pandas as pd import json import pprint # 读取csv文件 df = pd.read_csv('202205012-20230512.csv', header=None, skiprows=1, usecols=[1,2,3]) # 将数据转换为JSON格式 data = df.to_dict(orient='records') json_data = json.dumps(data) data_t = json.loads(json_data) for ele in data_t: print(ele['代码'])
这段代码的作用是读取一个csv文件,并将其中的数据转换为JSON格式,然后输出其中每行数据的“代码”这一列的值。
其中:
- 第1行声明编码格式为UTF-8;
- 第2行导入pandas库,用于数据处理;
- 第3行导入json库,用于JSON格式的编码和解码;
- 第5行利用pandas库读取csv文件(文件名为“202205012-20230512.csv”),跳过第1行表头,仅读取第2、3、4列(用cols参数指定),并将其转换为pandas的DataFrame对象df;
- 第8行将DataFrame对象df转换为JSON格式,存储在变量json_data中;
- 第10行将json_data解码为Python对象(即一个字典列表),存储在变量data_t中;
- 第12~14行遍历data_t中的每个字典元素,输出其中key为“代码”的value值。