编写一个函数:sklearn库自带的手写数字数据集进行切分处理,要求参数可以设置数据集的分割比例
时间: 2024-09-13 10:02:29 浏览: 58
在Python中,你可以使用scikit-learn(sklearn)库中的`train_test_split`函数对手写数字数据集进行划分。这个函数可以帮助你将数据集划分为训练集和测试集。下面是一个基本的例子,演示了如何使用这个函数,并允许用户自定义数据集的分割比例:
```python
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_digits
def split_data(dataset_path='digits', test_size=0.2, random_state=42):
# 加载手写数字数据集
digits = load_digits()
# 获取特征和目标变量
X = digits.data
y = digits.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=test_size, random_state=random_state)
return X_train, X_test, y_train, y_test
# 调用函数并指定分割比例
X_train, X_test, y_train, y_test = split_data(test_size=0.3) # 设置30%的数据作为测试集
阅读全文