pandas.DataFrame.sample
时间: 2023-07-07 15:30:06 浏览: 52
pandas.DataFrame.sample() 是一个函数,它可以从 DataFrame 中随机抽取一些行或列。它可以接受以下参数:
- n:要抽取的行数或列数,默认为 1。
- frac:要抽取的行数或列数的比例,默认为 None。如果 n 和 frac 都没有指定,那么默认抽取一行。
- replace:是否允许重复抽取,默认为 False。
- weights:每行或列的权重,默认为 None。
- random_state:随机数种子。
示例:
```
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]})
# 抽取一行
row = df.sample()
print(row)
# 抽取两行
rows = df.sample(n=2)
print(rows)
# 抽取一列
col = df.sample(axis=1)
print(col)
# 抽取两列
cols = df.sample(n=2, axis=1)
print(cols)
```
相关问题
pandas.Dataframe打乱顺序代码
可以使用pandas的shuffle()函数来打乱DataFrame的顺序,代码如下:
import pandas as pd
df = pd.read_csv('data.csv') # 读取数据
df_shuffled = df.sample(frac=1) # 打乱顺序
print(df_shuffled.head()) # 输出前5行
pandas.sample
pandas.sample() 是一个用于从DataFrame中随机抽取样本的函数。它可以帮助我们在数据集中获取随机的行或列。你可以通过设置抽样的数量来控制要抽取的样本大小。在使用该函数时,你可以指定是否允许重复抽样。
以下是一个示例:
```python
import pandas as pd
# 创建一个示例DataFrame
data = {'A': range(1, 11), 'B': range(11, 21), 'C': range(21, 31)}
df = pd.DataFrame(data)
# 从DataFrame中随机抽取3行
sample = df.sample(n=3)
print(sample)
```
输出结果可能是:
```
A B C
2 3 13 23
5 6 16 26
7 8 18 28
```
这个例子中,我们从DataFrame中随机抽取了3行,并将结果存储在`sample`变量中。每次运行代码,抽样结果都可能不同。