或自定义生成一个模拟身高数据集。数据包含年龄、性别和身高三个变量
时间: 2024-11-06 14:17:49 浏览: 7
可以使用Python的数据分析库pandas和numpy来创建一个模拟的身高数据集。首先,我们需要导入所需的库,然后随机生成一些样本数据。这里是一个简单的例子:
```python
import pandas as pd
import numpy as np
# 定义年龄范围和性别类别
age_range = (18, 70)
gender_choices = ['male', 'female']
# 创建一个数据框
data = {
'年龄': np.random.randint(age_range[0], age_range[1] + 1, size=100), # 随机整数生成100个年龄值
'性别': np.random.choice(gender_choices, size=100), # 随机选择性别
'身高': np.random.normal(loc=165, scale=10, size=100) # 正态分布随机生成身高,平均165cm,标准差10cm
}
df_height_data = pd.DataFrame(data)
# 打印前几行数据
print(df_height_data.head())
```
这个脚本会创建一个包含100条记录的数据表,每个记录有年龄、性别和随机生成的身高。`np.random.randint`用于随机整数生成,`np.random.choice`用于从给定列表中随机选择,`np.random.normal`用于生成正态分布的随机数。
阅读全文