Generate a dataset of 1 million random data items between 1 and 100 items using only pandas
时间: 2024-09-28 20:06:48 浏览: 20
在Python中,你可以使用pandas库生成一个包含1百万随机数据项的数据集,每个数据点范围在1到100之间。下面是一个简单的步骤来创建这样的数据集:
```python
import pandas as pd
# 设置随机种子以便于复现结果
np.random.seed(42)
# 定义数据量
num_items = 1000000
# 创建数据框,将列设为随机整数
data = pd.DataFrame({'Random_Item': np.random.randint(1, 101, num_items)})
# 确保DataFrame大小为1M行
assert data.shape[0] == num_items
# 打印数据集的一部分
print(data.head()) # 只显示前几行数据,实际全部数据保存到文件会更大
# 如果你想保存到CSV文件
data.to_csv('random_data_1m.csv', index=False)
```
在这个例子中,`np.random.randint(1, 101, num_items)`生成了指定数量的随机整数,范围从1到100(包括1和100)。然后我们将这些值放入一个pandas DataFrame中。