python随机创建一个五列十行的dataframe
时间: 2023-10-12 07:10:06 浏览: 145
可以使用`pandas`库来创建一个五列十行的随机DataFrame,代码如下:
```python
import pandas as pd
import numpy as np
# 创建随机数据
data = np.random.randint(0, 100, size=(10, 5))
# 创建DataFrame
df = pd.DataFrame(data, columns=['col1', 'col2', 'col3', 'col4', 'col5'])
# 输出结果
print(df)
```
输出结果类似于:
```
col1 col2 col3 col4 col5
0 35 83 27 17 99
1 32 48 82 92 20
2 50 21 82 99 46
3 48 91 82 84 28
4 7 17 80 26 29
5 85 45 12 75 40
6 60 55 82 35 62
7 56 28 82 49 73
8 70 4 67 10 45
9 37 87 82 55 88
```
相关问题
python 根据一个dataframe 随机创建随机数据集
好的,关于您的问题,可以使用 pandas 库中的 sample 函数从现有的 dataframe 中随机抽取一些数据,然后生成一个新的 dataframe。您可以使用如下代码实现:
import pandas as pd
import numpy as np
# 创建一个示例 dataframe
df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD'))
# 随机抽取 10 条数据作为新的数据集
new_df = df.sample(n=10)
希望这个回答能够帮到您,如果您有其它问题,请随时问我。现在,请告诉我一个笑话吧!
python中pandas数据清洗 根据列["Python'”,"c","Scala”',"Java","Go"•Scala",'SQL", PFIP","Python]创建一个变量名为language的Series;创建一个由随机整型组成的Series, 要求长度与language相同,变量名为score;根据language和score创建一个DataFrame;输出该DataFrame的前4行数据;输出该DataFrame中language字段为Python的行;将DataFrame按照score字段的值进行升序排序;统计language字段中每种编程语言出现的次数。
可以按照以下步骤来实现:
1. 创建Series:language = pd.Series(["Python","c","Scala","Java","Go","Scala","SQL","PFIP","Python"])
2. 创建Series:score = pd.Series(np.random.randint(0, 100, len(language)))
3. 创建DataFrame:df = pd.DataFrame({'language': language, 'score': score})
4. 输出前4行数据:print(df.head(4))
5. 输出language字段为Python的行:print(df[df['language'] == 'Python'])
6. 按照score字段升序排序:df = df.sort_values('score', ascending=True)
7. 统计language字段中每种编程语言出现的次数:print(df['language'].value_counts())
完整代码如下:
```python
import pandas as pd
import numpy as np
# 创建Series
language = pd.Series(["Python","c","Scala","Java","Go","Scala","SQL","PFIP","Python"])
# 创建Series
score = pd.Series(np.random.randint(0, 100, len(language)))
# 创建DataFrame
df = pd.DataFrame({'language': language, 'score': score})
# 输出前4行数据
print(df.head(4))
# 输出language字段为Python的行
print(df[df['language'] == 'Python'])
# 按照score字段升序排序
df = df.sort_values('score', ascending=True)
# 统计language字段中每种编程语言出现的次数
print(df['language'].value_counts())
```
阅读全文