df_train = df_log.iloc[ : -test_size] df_test = df_log.iloc[-test_size : ] df_train.shape,df_test.shape
时间: 2023-10-23 17:49:39 浏览: 120
URL的train和test的数据
这段代码是将数据集按照测试集大小(test_size)的比例拆分成训练集(train)和测试集(test)两部分,并分别赋值给 df_train 和 df_test 两个变量。
其中 df_log 是原始数据集, iloc[] 是 Pandas 中的索引方式,[ : -test_size] 表示选取从第 0 行到倒数第 test_size 行的数据作为训练集,[-test_size : ] 表示选取从倒数第 test_size 行到最后一行的数据作为测试集。
最后, df_train.shape 和 df_test.shape 分别输出训练集和测试集的维度信息,即行数和列数。
阅读全文