数据预处理,拆分数据集,分别 提取特征变量和目标变量 代码实现
时间: 2024-02-16 22:03:31 浏览: 104
对原始数据集进行预处理,窗口划分,特征提取,特征融合,分类识别.zip
5星 · 资源好评率100%
以下是Python代码实现数据预处理、拆分数据集、提取特征变量和目标变量的示例:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
# 读取数据集
data = pd.read_csv('data.csv')
# 提取特征变量和目标变量
X = data.iloc[:, :-1] # 特征变量
y = data.iloc[:, -1] # 目标变量
# 数据集拆分
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 对特征变量进行标准化处理
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
```
在上述代码中,首先我们使用pandas库中的`read_csv()`函数读取数据集,然后使用`iloc`函数分别提取特征变量和目标变量。接着,我们使用`train_test_split()`函数将数据集拆分为训练集和测试集,其中`test_size`参数设置测试集的大小,`random_state`参数设置随机数种子以保证每次拆分结果的一致性。
最后,我们使用`StandardScaler()`类对特征变量进行标准化处理。该类的`fit_transform()`方法可以对训练集进行标准化处理,并返回标准化后的结果。而`transform()`方法则可以使用训练集的均值和方差对测试集进行标准化处理。
阅读全文