DataFrame中的sample
时间: 2023-11-03 16:13:28 浏览: 38
在 Pandas 中,DataFrame 的 sample() 方法用于从 DataFrame 中随机抽取行或列。该方法可以用于随机选择一些数据进行分析或者测试模型的性能。
使用样例:
```python
import pandas as pd
# 创建一个 DataFrame
df = pd.DataFrame({'A': range(1, 6), 'B': range(2, 11, 2)})
# 抽取 DataFrame 的随机样本
sample = df.sample(n=3, replace=False, random_state=42)
print(sample)
```
输出:
```
A B
3 4 8
0 1 2
4 5 10
```
在上面的例子中,我们使用了 `sample()` 方法从 DataFrame `df` 中抽取了 3 行数据,其中参数 `n` 指定了抽取的行数,参数 `replace` 指定了是否允许抽取重复行,参数 `random_state` 指定了随机种子,保证每次运行程序得到的结果一致。当然,该方法还可以对列进行抽样,具体使用方式可以参考 Pandas 的官方文档。
相关问题
DataFrame.sample
DataFrame.sample() 方法用于从 DataFrame 中随机抽取样本。它可以接收一个可选的参数 `n`,表示抽取的样本数量,默认为 1。另外,还可以使用参数 `frac` 来指定抽取样本的比例,默认为 None。
示例用法:
```python
import pandas as pd
# 创建一个 DataFrame
data = {'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]}
df = pd.DataFrame(data)
# 抽取一个样本
sample = df.sample()
print(sample)
# 抽取两个样本
sample = df.sample(n=2)
print(sample)
# 抽取样本比例为50%
sample = df.sample(frac=0.5)
print(sample)
```
输出结果:
```
A B
4 5 10
A B
4 5 10
3 4 9
A B
2 3 8
4 5 10
```
这是一个随机过程,因此每次运行代码可能得到不同的结果。
pandas.DataFrame.sample
pandas.DataFrame.sample() 是一个函数,它可以从 DataFrame 中随机抽取一些行或列。它可以接受以下参数:
- n:要抽取的行数或列数,默认为 1。
- frac:要抽取的行数或列数的比例,默认为 None。如果 n 和 frac 都没有指定,那么默认抽取一行。
- replace:是否允许重复抽取,默认为 False。
- weights:每行或列的权重,默认为 None。
- random_state:随机数种子。
示例:
```
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]})
# 抽取一行
row = df.sample()
print(row)
# 抽取两行
rows = df.sample(n=2)
print(rows)
# 抽取一列
col = df.sample(axis=1)
print(col)
# 抽取两列
cols = df.sample(n=2, axis=1)
print(cols)
```