DataFrame.sample
时间: 2023-11-03 16:18:00 浏览: 151
DataFrame.sample() 方法用于从 DataFrame 中随机抽取样本。它可以接收一个可选的参数 `n`,表示抽取的样本数量,默认为 1。另外,还可以使用参数 `frac` 来指定抽取样本的比例,默认为 None。
示例用法:
```python
import pandas as pd
# 创建一个 DataFrame
data = {'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]}
df = pd.DataFrame(data)
# 抽取一个样本
sample = df.sample()
print(sample)
# 抽取两个样本
sample = df.sample(n=2)
print(sample)
# 抽取样本比例为50%
sample = df.sample(frac=0.5)
print(sample)
```
输出结果:
```
A B
4 5 10
A B
4 5 10
3 4 9
A B
2 3 8
4 5 10
```
这是一个随机过程,因此每次运行代码可能得到不同的结果。
相关问题
pandas.DataFrame.sample
pandas.DataFrame.sample() 是一个函数,它可以从 DataFrame 中随机抽取一些行或列。它可以接受以下参数:
- n:要抽取的行数或列数,默认为 1。
- frac:要抽取的行数或列数的比例,默认为 None。如果 n 和 frac 都没有指定,那么默认抽取一行。
- replace:是否允许重复抽取,默认为 False。
- weights:每行或列的权重,默认为 None。
- random_state:随机数种子。
示例:
```
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]})
# 抽取一行
row = df.sample()
print(row)
# 抽取两行
rows = df.sample(n=2)
print(rows)
# 抽取一列
col = df.sample(axis=1)
print(col)
# 抽取两列
cols = df.sample(n=2, axis=1)
print(cols)
```
statistical summary of the dataframe.
Sure, I can provide you with a statistical summary of a dataframe. In Python, you can use the describe() method to get a statistical summary of a dataframe. Here is an example code snippet:
```
import pandas as pd
# create a sample dataframe
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [2, 4, 6, 8, 10], 'C': [3, 6, 9, 12, 15]})
# get the statistical summary of the dataframe
summary = df.describe()
# print the summary
print(summary)
```
This will output the following statistical summary of the dataframe:
```
A B C
count 5.000000 5.000000 5.000000
mean 3.000000 6.000000 9.000000
std 1.581139 3.162278 4.743416
min 1.000000 2.000000 3.000000
25% 2.000000 4.000000 6.000000
50% 3.000000 6.000000 9.000000
75% 4.000000 8.000000 12.000000
max 5.000000 10.000000 15.000000
```
This summary provides information such as the count, mean, standard deviation, minimum, maximum, and quartiles for each column in the dataframe.
阅读全文