删除数据——探索Iris纸鸢花数据 (1) 将数据集存成变量iris (2) 创建数据框的列名称['sepal_length','sepal_width', 'petal_length', 'petal_width', 'class'] (3) 数据框中有缺失值吗? (4) 将列petal_length的第10到19行设置为缺失值 (5) 将petal_lengt缺失值全部替换为1.0 (6) 删除列class (7) 将数据框前三行设置为缺失值 (8) 删除有缺失值的行 (9) 重新设置索引
时间: 2024-03-12 18:44:57 浏览: 245
好的,我会逐一回答您的问题。
1. 将数据集存成变量iris:
```python
from sklearn.datasets import load_iris
iris = load_iris()
```
2. 创建数据框的列名称['sepal_length','sepal_width', 'petal_length', 'petal_width', 'class']:
```python
import pandas as pd
columns = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'class']
iris_df = pd.DataFrame(data=iris.data, columns=columns)
```
3. 数据框中有缺失值吗?
在创建数据框时,我们并没有发现缺失值。我们可以使用以下代码检查:
```python
iris_df.isnull().sum()
```
输出结果为:
```
sepal_length 0
sepal_width 0
petal_length 0
petal_width 0
class 0
dtype: int64
```
即数据框中没有缺失值。
4. 将列petal_length的第10到19行设置为缺失值:
```python
iris_df.loc[9:18, 'petal_length'] = np.nan
```
5. 将petal_length缺失值全部替换为1.0:
```python
iris_df['petal_length'].fillna(value=1.0, inplace=True)
```
6. 删除列class:
```python
iris_df.drop('class', axis=1, inplace=True)
```
7. 将数据框前三行设置为缺失值:
```python
iris_df.iloc[:3, :] = np.nan
```
8. 删除有缺失值的行:
```python
iris_df.dropna(inplace=True)
```
9. 重新设置索引:
```python
iris_df.reset_index(drop=True, inplace=True)
```
阅读全文