如何用sklearn导入外部数据集
时间: 2024-05-03 15:16:28 浏览: 138
1.线性回归_红酒数据集_
5星 · 资源好评率100%
你可以使用sklearn中的datasets模块来加载自己的外部数据集。首先,将你的数据集存储为CSV或其他常见格式的文件。然后,使用pandas或其他数据处理库将其读入内存:
```python
import pandas as pd
data = pd.read_csv('your_data.csv')
```
接下来,将数据拆分成特征和目标变量:
```python
X = data.drop(columns=['target_column'])
y = data['target_column']
```
最后,使用sklearn的train_test_split函数将数据集拆分为训练集和测试集:
```python
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
```
现在,你就可以将X_train和y_train用于训练你的模型,将X_test用于测试。
阅读全文