# 定义全局变量 file_path = "" train_ratio = 0.8# 划分训练集和测试集 def split_train_test(): global file_path, train_ratio # 读取CSV文件 data = pd.read_csv(file_path) # 划分数据集 train, test = train_test_split(data, train_size=train_ratio) # 显示训练集和测试集大小 text_output.insert(tk.END, "训练集大小:{}\n".format(len(train))) text_output.insert(tk.END, "测试集大小:{}\n".format(len(test)))怎么样写代码可以是用户自由划分测试集与训练集
时间: 2024-02-13 07:01:29 浏览: 99
php中file_get_contents()函数用法实例
你可以修改 `split_train_test` 函数,让它接受一个参数 `test_ratio`,表示测试集占总数据集的比例。然后根据传入的 `test_ratio` 计算出 `train_ratio`,并使用它来划分训练集和测试集。以下是修改后的代码示例:
```python
# 定义全局变量 file_path = ""
test_ratio = 0.2 # 测试集占比
train_ratio = 1 - test_ratio # 训练集占比
# 划分训练集和测试集
def split_train_test(test_ratio):
global file_path, train_ratio
# 读取CSV文件
data = pd.read_csv(file_path)
# 划分数据集
train, test = train_test_split(data, test_size=test_ratio)
# 显示训练集和测试集大小
text_output.insert(tk.END, "训练集大小:{}\n".format(len(train)))
text_output.insert(tk.END, "测试集大小:{}\n".format(len(test)))
```
然后在调用 `split_train_test` 函数时,传入你想要的测试集占比即可。例如,如果你想要测试集占总数据集的 30%,可以这样调用:
```python
split_train_test(0.3)
```
阅读全文