首页dataset = df1.values np.random.shuffle(dataset)和arr = df1.values np.random.shuffle(arr)有什么区别

dataset = df1.values np.random.shuffle(dataset)和arr = df1.values np.random.shuffle(arr)有什么区别

时间: 2024-05-04 18:17:57 浏览: 108

这两个代码有一些细微的区别。 - `dataset = df1.values`：将 DataFrame `df1` 转换为 NumPy 数组 `dataset`。 - `arr = df1.values`：同样将 DataFrame `df1` 转换为 NumPy 数组 `arr`。这两行代码的作用是完全相同的，都是将 DataFrame 转换为 NumPy 数组。但是，如果接下来的代码中使用的变量名称不同，那么这两个代码的影响将会不同。 - `np.random.shuffle(dataset)`：在原地对 `dataset` 数组进行乱序操作。由于 `dataset` 是一个变量，它指向了一个内存地址，所以乱序操作会直接修改内存中的数组内容。 - `np.random.shuffle(arr)`：同样在原地对 `arr` 数组进行乱序操作。但是由于变量名称不同，这个乱序操作会影响另一个不同的内存地址中的数组，即 `arr` 所指向的内存地址。因此，如果你想要对 DataFrame 数据进行乱序操作，应该先将其转换为 NumPy 数组，并对该数组进行乱序操作，如下所示： ```python import numpy as np import pandas as pd df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) dataset = df1.values np.random.shuffle(dataset) print(dataset) ``` 输出： ``` [[1 4] [3 6] [2 5]] ```

阅读全文