Jupyter对2018年数据最高价和最低价列填充平均值
时间: 2024-01-22 14:18:49 浏览: 134
求数据中的最大值和最小值
4星 · 用户满意度95%
首先,你需要导入需要的库,如pandas和numpy。然后,读取你的数据集,并计算2018年数据的最高价和最低价的平均值。
下面是一个示例代码:
```python
import pandas as pd
import numpy as np
# 读取数据集
data = pd.read_csv("your_data.csv")
# 提取2018年的数据
data_2018 = data[data['Year'] == 2018]
# 计算最高价和最低价的平均值
mean_high = np.mean(data_2018['High'])
mean_low = np.mean(data_2018['Low'])
# 使用平均值填充缺失值
data_2018['High'].fillna(mean_high, inplace=True)
data_2018['Low'].fillna(mean_low, inplace=True)
# 将填充后的数据保存为新的文件
data_2018.to_csv("new_data.csv", index=False)
```
请注意,这里假设你的数据集中包含一个名为“Year”的列,用于表示每条记录所属的年份。如果你的数据集中没有这样的列,你需要根据数据集中实际的列进行调整。
阅读全文