如何使用Python生成3列500万行数据,第一列自动递增,第二列为字符串,第三列为时间戳
时间: 2024-05-06 16:21:23 浏览: 86
python如何快速生成时间戳
5星 · 资源好评率100%
可以使用Python中的pandas和numpy库来快速生成大量数据,下面是一个示例代码:
```python
import pandas as pd
import numpy as np
import time
# 生成500万行数据
n = 5000000
# 第一列自动递增
col1 = np.arange(1, n+1)
# 第二列为随机字符串
col2 = np.random.choice(["apple", "orange", "banana"], size=n)
# 第三列为时间戳
col3 = pd.date_range(start="2021-01-01", periods=n, freq="min").astype(np.int64) // 10**9
# 将三列数据组合成一个dataframe
df = pd.DataFrame({"col1": col1, "col2": col2, "col3": col3})
# 输出前5行
print(df.head())
```
这个代码可以生成三列数据,第一列为自动递增的数字,第二列为三个字符串中的随机选择,第三列为时间戳。输出前5行的结果如下:
```
col1 col2 col3
0 1 orange 1609459200
1 2 apple 1609459260
2 3 apple 1609459320
3 4 apple 1609459380
4 5 banana 1609459440
```
希望这个解决方案能够满足你的需求。
阅读全文