pandas.sample
时间: 2023-07-17 22:02:07 浏览: 64
pandas.sample() 是一个用于从DataFrame中随机抽取样本的函数。它可以帮助我们在数据集中获取随机的行或列。你可以通过设置抽样的数量来控制要抽取的样本大小。在使用该函数时,你可以指定是否允许重复抽样。
以下是一个示例:
```python
import pandas as pd
# 创建一个示例DataFrame
data = {'A': range(1, 11), 'B': range(11, 21), 'C': range(21, 31)}
df = pd.DataFrame(data)
# 从DataFrame中随机抽取3行
sample = df.sample(n=3)
print(sample)
```
输出结果可能是:
```
A B C
2 3 13 23
5 6 16 26
7 8 18 28
```
这个例子中,我们从DataFrame中随机抽取了3行,并将结果存储在`sample`变量中。每次运行代码,抽样结果都可能不同。
相关问题
pandas.DataFrame.sample
pandas.DataFrame.sample() 是一个函数,它可以从 DataFrame 中随机抽取一些行或列。它可以接受以下参数:
- n:要抽取的行数或列数,默认为 1。
- frac:要抽取的行数或列数的比例,默认为 None。如果 n 和 frac 都没有指定,那么默认抽取一行。
- replace:是否允许重复抽取,默认为 False。
- weights:每行或列的权重,默认为 None。
- random_state:随机数种子。
示例:
```
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]})
# 抽取一行
row = df.sample()
print(row)
# 抽取两行
rows = df.sample(n=2)
print(rows)
# 抽取一列
col = df.sample(axis=1)
print(col)
# 抽取两列
cols = df.sample(n=2, axis=1)
print(cols)
```
DataFrame.sample
DataFrame.sample() 方法用于从 DataFrame 中随机抽取样本。它可以接收一个可选的参数 `n`,表示抽取的样本数量,默认为 1。另外,还可以使用参数 `frac` 来指定抽取样本的比例,默认为 None。
示例用法:
```python
import pandas as pd
# 创建一个 DataFrame
data = {'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]}
df = pd.DataFrame(data)
# 抽取一个样本
sample = df.sample()
print(sample)
# 抽取两个样本
sample = df.sample(n=2)
print(sample)
# 抽取样本比例为50%
sample = df.sample(frac=0.5)
print(sample)
```
输出结果:
```
A B
4 5 10
A B
4 5 10
3 4 9
A B
2 3 8
4 5 10
```
这是一个随机过程,因此每次运行代码可能得到不同的结果。