将DataFrame 对象 df_data的行数据打乱,选择前 900 部电影信息创建 DataFrame 对象 df_train,后一百部电影信息 创建 DataFrame 对象 df_test。
时间: 2023-09-07 12:05:05 浏览: 225
数据集分割train和test程序
### 回答1:
你可以使用 df_data.sample() 方法打乱 DataFrame 的行数据。
比如,你可以使用如下代码打乱 df_data 的行数据:
```
df_data = df_data.sample(frac=1)
```
然后,你可以使用 df_data 的前 900 行创建 df_train:
```
df_train = df_data.head(900)
```
最后,你可以使用 df_data 的后 100 行创建 df_test:
```
df_test = df_data.tail(100)
```
如果你想按照索引的顺序来选择行,可以使用 df_data.iloc[] 方法。
### 回答2:
将DataFrame对象df_data的行数据打乱可以使用pandas的sample()函数实现。代码如下:
```
import pandas as pd
# 将df_data的行数据打乱
df_data_shuffled = df_data.sample(frac=1, random_state=42)
# 选择前900部电影信息创建df_train
df_train = df_data_shuffled.head(900)
# 后100部电影信息创建df_test
df_test = df_data_shuffled.tail(100)
```
首先,我们利用`sample()`函数将df_data的行数据打乱,通过设置`frac=1`参数保证将所有行数据打乱。`random_state`参数可以用于控制随机种子,保证每次运行结果一致。
然后,我们使用`head()`函数选取打乱后的前900行数据,创建df_train对象,这样即可得到DataFrame对象df_train。
接着,我们使用`tail()`函数选取打乱后的后100行数据,创建df_test对象,这样即可得到DataFrame对象df_test。
至此,我们通过对df_data的行数据进行打乱,成功创建了df_train和df_test两个DataFrame对象,其中df_train包含前900部电影的信息,df_test包含后100部电影的信息。
### 回答3:
将DataFrame对象df_data的行数据打乱可以使用pandas中的sample函数。下面是一种实现方式:
import pandas as pd
# 打乱行数据
df_data_shuffled = df_data.sample(frac=1, random_state=42)
# 将前900部电影信息创建为df_train
df_train = df_data_shuffled[:900]
# 将后100部电影信息创建为df_test
df_test = df_data_shuffled[900:]
使用sample函数时,frac=1表示取全部行数据,random_state=42表示设定随机种子,保证每次结果一致。
通过切片的方式将打乱后的数据集前900部电影信息和后100部电影信息分别创建为df_train和df_test。
阅读全文