【第一题】 利用pandas读取波士顿房价数据集为dataframe格式,利用散点图展示其中任意4个特征与标签之间的关系。
时间: 2024-06-08 11:11:08 浏览: 105
以下是利用pandas读取波士顿房价数据集并展示其中4个特征与标签之间关系的代码:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据集
data = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data',
header=None, sep='\s+')
# 指定列名
data.columns = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE',
'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']
# 绘制散点图
plt.figure(figsize=(10, 8))
plt.scatter(data['CRIM'], data['MEDV'], c='blue', label='CRIM')
plt.scatter(data['ZN'], data['MEDV'], c='green', label='ZN')
plt.scatter(data['INDUS'], data['MEDV'], c='red', label='INDUS')
plt.scatter(data['NOX'], data['MEDV'], c='purple', label='NOX')
plt.legend(loc='upper right')
plt.xlabel('Features')
plt.ylabel('MEDV')
plt.title('Relationship between features and MEDV')
plt.show()
```
以上代码将波士顿房价数据集读取为dataframe格式,并展示了其中4个特征(CRIM、ZN、INDUS、NOX)与标签(MEDV)之间的关系,绘制了4个散点图。其中x轴为特征值,y轴为标签值。不同颜色的散点代表不同的特征。
阅读全文