如恶化对dataframe的列A-C的数据进行描述性统计
时间: 2024-05-08 10:17:19 浏览: 5
可以使用dataframe的describe()函数对列A-C的数据进行描述性统计,示例代码如下:
```python
import pandas as pd
# 创建示例数据
data = {'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50], 'C': [100, 200, 300, 400, 500]}
df = pd.DataFrame(data)
# 对列A-C进行描述性统计
df[['A', 'B', 'C']].describe()
```
输出结果如下:
```
A B C
count 5.000000 5.000000 5.000000
mean 3.000000 30.000000 300.000000
std 1.581139 15.811388 158.113883
min 1.000000 10.000000 100.000000
25% 2.000000 20.000000 200.000000
50% 3.000000 30.000000 300.000000
75% 4.000000 40.000000 400.000000
max 5.000000 50.000000 500.000000
```
可以看到,describe()函数输出了每个列的样本数、均值、标准差、最小值、25%分位数、中位数、75%分位数和最大值。
相关问题
如何对dataframe的列A-C的数据进行描述性统计,并保留三位小数
可以使用describe()方法对列A-C的数据进行描述性统计,然后使用round()方法保留三位小数。
假设DataFrame为df,以下是示例代码:
```
df[['A', 'B', 'C']].describe().round(3)
```
其中[['A', 'B', 'C']]表示要对哪些列进行统计,describe()方法返回描述性统计信息,round()方法保留三位小数。
dataframe对每一列数据进行统计
可以使用 Pandas 库中的 `describe()` 方法对 DataFrame 中每一列的数据进行统计。该方法会输出每一列数据的计数、均值、标准差、最小值、25%、50%、75% 和最大值等统计信息。示例如下:
```python
import pandas as pd
# 创建示例 DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
# 对每一列数据进行统计
print(df.describe())
```
输出结果为:
```
A B C
count 3.0 3.0 3.0
mean 2.0 5.0 8.0
std 1.0 1.0 1.0
min 1.0 4.0 7.0
25% 1.5 4.5 7.5
50% 2.0 5.0 8.0
75% 2.5 5.5 8.5
max 3.0 6.0 9.0
```