3、将Fog列中的缺省值使用前后两个相邻值的均值的方式完成填充; 4、删除数据中的重复行; 5、使用corr函数分析各列的相关性; 6、将Temp列和Humi列进行标准差标准化,将Fog列进行离差标准化; 7、将Target列中取值为正常的替换成数值0,取值为一般的替换成1,取值为严重的替换成2。
时间: 2023-11-28 07:47:59 浏览: 73
3、使用前后两个相邻值的均值的方式填充Fog列中的缺省值,可以使用以下代码实现:
```python
df['Fog'].fillna((df['Fog'].shift(1) + df['Fog'].shift(-1))/2, inplace=True)
```
4、删除数据中的重复行,可以使用以下代码实现:
```python
df.drop_duplicates(inplace=True)
```
5、使用corr函数分析各列的相关性,可以使用以下代码实现:
```python
corr_matrix = df.corr()
print(corr_matrix)
```
6、将Temp列和Humi列进行标准差标准化,将Fog列进行离差标准化,可以使用以下代码实现:
```python
from sklearn.preprocessing import StandardScaler, MinMaxScaler
scaler = StandardScaler()
df['Temp'] = scaler.fit_transform(df['Temp'].values.reshape(-1, 1))
df['Humi'] = scaler.fit_transform(df['Humi'].values.reshape(-1, 1))
scaler = MinMaxScaler()
df['Fog'] = scaler.fit_transform(df['Fog'].values.reshape(-1, 1))
```
7、将Target列中取值为正常的替换成数值0,取值为一般的替换成1,取值为严重的替换成2,可以使用以下代码实现:
```python
df['Target'] = df['Target'].replace({'正常': 0, '一般': 1, '严重': 2})
```
阅读全文