pd.dataframe().sum()
时间: 2023-09-07 11:14:08 浏览: 33
这是一个 Pandas 库中的 DataFrame 类的方法,用于计算 DataFrame 中每列的总和。具体来说,它会返回一个 Series,其中每个元素对应 DataFrame 中每列的总和。示例代码如下:
```python
import pandas as pd
# 创建一个示例 DataFrame
df = pd.DataFrame({
'A': [1, 2, 3],
'B': [4, 5, 6],
'C': [7, 8, 9]
})
# 计算每列的总和
col_sum = df.sum()
# 打印结果
print(col_sum)
```
输出:
```
A 6
B 15
C 24
dtype: int64
```
相关问题
pd.dataframe用法
Pandas中的DataFrame是一种二维数据结构,类似于Excel中的表格。可以使用pd.DataFrame()函数创建一个DataFrame。常用的参数有:
- data: 二维数组或其它可以转换成DataFrame的对象,如列表、字典、Series等。
- columns: 列名
- index: 行索引
例如,可以用下面的代码创建一个DataFrame:
```
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'city': ['New York', 'Los Angeles', 'Chicago']}
df = pd.DataFrame(data)
```
可以使用下标访问DataFrame中的数据,如df[0]或df['name']。也可以使用布尔索引筛选数据,如df[df['age'] > 30]。DataFrame还提供了很多用于数据处理和统计分析的方法,如groupby、agg、sum等。
pd.DataFrame用法
`pd.DataFrame` 是 pandas 库中的一个类,用于创建和操作二维表格数据。下面是一些常用的用法:
### 创建 DataFrame
可以从各种数据源创建 DataFrame,例如:
- 从 list 或 ndarray 创建 DataFrame:
```python
import pandas as pd
data = [['Alice', 20], ['Bob', 25], ['Charlie', 30]]
df = pd.DataFrame(data, columns=['Name', 'Age'])
print(df)
```
输出:
```
Name Age
0 Alice 20
1 Bob 25
2 Charlie 30
```
- 从 dictionary 创建 DataFrame:
```python
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [20, 25, 30]}
df = pd.DataFrame(data)
print(df)
```
输出:
```
Name Age
0 Alice 20
1 Bob 25
2 Charlie 30
```
### 数据操作
DataFrame 支持各种数据操作,例如:
- 选择行或列:
```python
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [20, 25, 30]}
df = pd.DataFrame(data)
# 选择第一行
print(df.loc[0])
# 选择 'Name' 列
print(df['Name'])
```
输出:
```
Name Alice
Age 20
Name: 0, dtype: object
0 Alice
1 Bob
2 Charlie
Name: Name, dtype: object
```
- 添加新列:
```python
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [20, 25, 30]}
df = pd.DataFrame(data)
# 添加新列 'Gender'
df['Gender'] = ['F', 'M', 'M']
print(df)
```
输出:
```
Name Age Gender
0 Alice 20 F
1 Bob 25 M
2 Charlie 30 M
```
- 删除行或列:
```python
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [20, 25, 30]}
df = pd.DataFrame(data)
# 删除第一行
df = df.drop(0)
# 删除 'Age' 列
df = df.drop('Age', axis=1)
print(df)
```
输出:
```
Name
1 Bob
2 Charlie
```
### 数据统计
DataFrame 支持各种数据统计,例如:
- 求和:
```python
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [20, 25, 30]}
df = pd.DataFrame(data)
# 计算 'Age' 列的和
print(df['Age'].sum())
```
输出:
```
75
```
- 求均值:
```python
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [20, 25, 30]}
df = pd.DataFrame(data)
# 计算 'Age' 列的均值
print(df['Age'].mean())
```
输出:
```
25.0
```
- 求标准差:
```python
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [20, 25, 30]}
df = pd.DataFrame(data)
# 计算 'Age' 列的标准差
print(df['Age'].std())
```
输出:
```
4.08248290463863
```
这只是一些常用的用法,pandas 还有很多功能和用法,可以参考官方文档了解更多。
阅读全文