帮我写一段机器学习划分测试集和训练集的python代码
时间: 2023-10-08 20:08:03 浏览: 41
好的,以下是Python代码示例:
```python
import numpy as np
from sklearn.model_selection import train_test_split
# 假设有X和y两个数据集,其中X为特征矩阵,y为标签
X = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]])
y = np.array([0, 1, 0, 1])
# 使用train_test_split函数划分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 参数test_size表示测试集占比,random_state保证每次运行代码时得到的结果一致,可以不设置
# 输出训练集和测试集的大小
print("训练集大小:" + str(X_train.shape))
print("测试集大小:" + str(X_test.shape))
```
上述代码使用了sklearn库中的train_test_split函数,可以将输入的数据集划分成训练集和测试集。其中test_size参数指定测试集的占比,random_state参数可选,可以让每次划分数据集得到的结果一致。
相关问题
帮我写一个机器学习的分类问题案例代码
好的,以下是一个简单的机器学习分类问题案例代码,使用的是 Python 和 Scikit-learn 库:
```python
# 导入所需库
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
# 加载数据集
iris = load_iris()
# 划分数据集为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3)
# 创建决策树分类器
clf = DecisionTreeClassifier()
# 训练模型
clf.fit(X_train, y_train)
# 预测测试集结果
y_pred = clf.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
```
这段代码使用了鸢尾花数据集(iris),将数据集划分为训练集和测试集,使用了决策树分类器进行模型训练,然后预测测试集结果并计算准确率。这是一个非常基础的机器学习分类问题案例,可以作为学习机器学习的入门练习。
帮我写一个机器学习的回归问题案例代码
好的,以下是一个简单的机器学习回归问题案例代码,同样使用的是 Python 和 Scikit-learn 库:
```python
# 导入所需库
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
# 加载数据集
boston = load_boston()
# 划分数据集为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(boston.data, boston.target, test_size=0.3)
# 创建线性回归模型
model = LinearRegression()
# 训练模型
model.fit(X_train, y_train)
# 预测测试集结果
y_pred = model.predict(X_test)
# 计算均方误差
mse = mean_squared_error(y_test, y_pred)
print("MSE:", mse)
```
这段代码使用了波士顿房价数据集(boston),将数据集划分为训练集和测试集,使用了线性回归模型进行模型训练,然后预测测试集结果并计算均方误差(MSE)。这是一个非常基础的机器学习回归问题案例,可以作为学习机器学习的入门练习。