调用sklearm中波士顿房价数据集
时间: 2024-09-28 08:08:18 浏览: 38
在scikit-learn库中,波士顿房价数据集是一个经典的回归任务示例,它包含了马萨诸塞州波士顿市区1970年代中期的房屋价格信息以及相关的特征描述。要加载这个数据集并进行分析,你可以按照以下步骤操作:
1. 导入所需库:
```python
from sklearn.datasets import load_boston
import pandas as pd
```
2. 加载数据集:
```python
boston = load_boston()
```
`load_boston()`函数会返回一个名为`BostonDataname`的对象,包含数据集和一些元数据。
3. 获取数据:
```python
data = boston.data
target = boston.target
feature_names = boston.feature_names
```
`data`变量存储了特征数组,`target`存储了对应的房屋价格,`feature_names`则列出了每个特征的名称。
4. 将数据转换成pandas DataFrame(如果需要):
```python
df = pd.DataFrame(data, columns=feature_names)
df['PRICE'] = target
```
现在你有了一个DataFrame,便于进一步的数据探索、可视化和模型训练。
5. 分割数据集(如需做训练集和测试集):
```python
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(data, target, test_size=0.2, random_state=42)
```
6. 使用波士顿房价数据集训练机器学习模型(例如线性回归模型):
```python
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X_train, y_train)
```
阅读全文