#name_one = [fake.name() for i in range(100)] name_two = [fake.name() for i in range(20)] #date_list = [fake.date_between(start_date='-1y', end_date='today') for i in range(100)] data_df1=pd.read_excel(r"D:\xxx.xls") #print(data_df1.columns) data_df2=(data_df1["部门"].unique()) print(data_df2) for i in range(150): ks_list=[data_df2] if random.random() < 0.5: prefix = random.choice(ks_list) data_df3 = prefix +str(" ") + name_two print(data_df3) 修改
时间: 2024-02-17 12:04:39 浏览: 162
根据您的代码,我看到您想要生成一些假的数据并进行一些处理。如果您想要将 `name_two` 列表中的每个元素与 `data_df2` 中的每个元素随机组合,可以尝试以下代码:
```python
import random
from faker import Faker
import pandas as pd
fake = Faker()
name_one = [fake.name() for i in range(100)]
name_two = [fake.name() for i in range(20)]
data_df1 = pd.read_excel(r"D:\xxx.xls")
data_df2 = data_df1["部门"].unique()
data_df3 = []
for i in range(150):
prefix = random.choice(data_df2)
if random.random() < 0.5:
suffix = random.choice(name_two)
else:
suffix = random.choice(name_one)
data_df3.append(prefix + " " + suffix)
data_df3 = pd.DataFrame(data_df3, columns=["新员工姓名"])
print(data_df3)
```
这样,您会得到一个名为 `data_df3` 的 Pandas 数据帧,其中包含了 `data_df2` 中的每个元素和 `name_one` 或 `name_two` 中的随机元素组合而成的新员工姓名。
阅读全文