import numpy as np import pandas as pd import matplotlib.pyplot as plt def student(): train = pd.read_csv('Task1/diabetes_null.csv', na_values=['#NAME?']) train['Insulin'] = train['Insulin'].fillna(100) train['SkinThickness'] = train['SkinThickness'].fillna(train['SkinThickness'].median()) train['BloodPressure'] = train['BloodPressure'].fillna(train['BloodPressure'].median()) train['BMI'] = train['BMI'].fillna(train['BMI'].mean()) train['Glucose'] = train['Glucose'].fillna(train['Glucose'].mean()) #********* Begin *********# plt.figure(figsize=(10,10)) x=pd.Series(train['Age']) count=x.value_counts() count.plot(kind='bar') plt.savefig("Task1/img/T1.png") plt.show() #********* End *********#
时间: 2023-06-18 17:02:28 浏览: 92
这段代码是一个函数,主要功能是处理缺失值并绘制一个柱状图。具体来说,它读取了一个名为“diabetes_null.csv”的CSV文件,并将其中的“Insulin”列中的缺失值填充为100,将“SkinThickness”列中的缺失值填充为该列的中位数,将“BloodPressure”列中的缺失值填充为该列的中位数,将“BMI”列中的缺失值填充为该列的均值,将“Glucose”列中的缺失值填充为该列的均值。然后,它绘制了一个柱状图,显示了数据集中每个年龄的人数,并将图像保存到名为“T1.png”的文件中。最后,函数在控制台中显示了该图像。
相关问题
import numpy as np import pandas as pd import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
这段代码是用于引入numpy、pandas和matplotlib.pyplot库。numpy是一个用于数值计算的库,pandas是一个用于数据分析的库,matplotlib.pyplot是一个用于绘制图表的库。
import numpy as np import scipy.stats as ss import pandas as pd import matplotlib.pyplot as plt import seaborn as sns df=pd.read_excel("./tmp_apply3.xlsx")读入后怎么取字段
你可以使用 Pandas 的 `loc` 或 `iloc` 方法来取出 DataFrame 中的特定字段。具体而言,`loc` 方法可以通过列名来取出字段,而 `iloc` 方法可以通过列的索引来取出字段。以下是两种方法的示例:
假设你要取出 `df` 中的 `sale` 和 `date` 两个字段,其中 `sale` 字段在第 2 列,`date` 字段在第 3 列,你可以这样做:
使用 `loc` 方法:
```python
# 通过列名取出字段
df_new = df.loc[:, ["sale", "date"]]
```
使用 `iloc` 方法:
```python
# 通过列的索引取出字段
df_new = df.iloc[:, [1, 2]]
```
上述代码中,`df_new` 就是取出 `df` 中的 `sale` 和 `date` 两个字段后得到的新 DataFrame。其中 `:` 表示取出所有行,`["sale", "date"]` 或 `[1, 2]` 表示取出第 2 列和第 3 列。你可以根据实际需要修改这些代码。
阅读全文