使用sklearn中的波士顿房价数据集利用pandas读取波士顿房价数据集为dataframe格式,利用散点图展示其中任意4个特征与标签之间的关系
时间: 2024-04-29 21:21:37 浏览: 11
好的,以下是示例代码:
```
from sklearn.datasets import load_boston
import pandas as pd
import matplotlib.pyplot as plt
# 加载波士顿房价数据集
boston = load_boston()
# 将数据集转为DataFrame格式
boston_df = pd.DataFrame(boston.data, columns=boston.feature_names)
boston_df['PRICE'] = boston.target
# 选择任意4个特征
feature_names = ['CRIM', 'NOX', 'RM', 'DIS']
# 绘制散点图
for feature_name in feature_names:
plt.figure()
plt.scatter(boston_df[feature_name], boston_df['PRICE'])
plt.xlabel(feature_name)
plt.ylabel('PRICE')
plt.show()
```
以上代码中,我们首先利用`load_boston()`函数加载波士顿房价数据集,然后将数据集转为Pandas的DataFrame格式。接着,我们选择了4个特征(`CRIM`、`NOX`、`RM`、`DIS`),并分别绘制了它们与标签(`PRICE`)之间的散点图。你可以根据自己的需求选择不同的特征进行绘制。
相关问题
利用Python求一个波士顿房价数据集csv文件,绘制CRIM的折线图和散点图以及MEDV的折线图和散点图,折线图和散点图绘制在一张图片
好的,我可以帮您解决这个问题。首先,确保您已经安装了matplotlib和pandas库,然后按照以下步骤进行操作:
1. 导入需要的库:
```python
import pandas as pd
import matplotlib.pyplot as plt
```
2. 使用pandas读取波士顿房价数据集csv文件,并存储在一个名为df的DataFrame中:
```python
df = pd.read_csv('boston_housing.csv')
```
3. 绘制CRIM的折线图和散点图:
```python
plt.figure(figsize=(10, 5))
plt.plot(df['CRIM'], label='CRIM')
plt.scatter(df.index, df['CRIM'], s=5)
plt.legend()
plt.ylabel('CRIM')
```
4. 绘制MEDV的折线图和散点图:
```python
plt.plot(df['MEDV'], label='MEDV')
plt.scatter(df.index, df['MEDV'], s=5)
plt.legend()
plt.ylabel('MEDV')
plt.xlabel('Index')
```
5. 显示图像:
```python
plt.show()
```
完整代码如下:
```python
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('boston_housing.csv')
plt.figure(figsize=(10, 5))
plt.plot(df['CRIM'], label='CRIM')
plt.scatter(df.index, df['CRIM'], s=5)
plt.plot(df['MEDV'], label='MEDV')
plt.scatter(df.index, df['MEDV'], s=5)
plt.legend()
plt.ylabel('Value')
plt.xlabel('Index')
plt.show()
```
运行完后,您将会得到一张包含折线图和散点图的图像,其中包含了CRIM和MEDV的数据。
pandas读取breast_cancer数据集,并绘图
以下是使用Python和Pandas库读取乳腺癌数据集并进行简单绘图的代码:
```python
# 导入所需的库和函数
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_breast_cancer
# 加载乳腺癌数据集
cancer = load_breast_cancer()
# 将数据集转换为DataFrame
df = pd.DataFrame(cancer['data'], columns=cancer['feature_names'])
# 绘制直方图
df.hist(figsize=(10,10))
plt.show()
# 绘制散点图
plt.scatter(df['mean radius'], df['mean texture'], c=cancer['target'], cmap='coolwarm')
plt.xlabel('Mean Radius')
plt.ylabel('Mean Texture')
plt.show()
```
这段代码首先使用Pandas库将乳腺癌数据集加载到DataFrame中。然后,它使用DataFrame.hist()方法绘制所有特征的直方图。接下来,它使用matplotlib库绘制了一个散点图,其中x轴是平均半径,y轴是平均质地,点的颜色根据目标值(恶性或良性)进行分类。