pandas 计算dataframe某列的所有值的长度
时间: 2023-08-15 08:15:10 浏览: 470
可以使用`len()`函数结合`apply()`方法来计算某一列所有值的长度之和。示例如下:
```python
import pandas as pd
# 创建一个示例 dataframe
df = pd.DataFrame({'A': ['foo', 'bar', 'baz'], 'B': ['hello', 'world', 'python']})
# 计算列 B 所有值的长度之和
total_len = len(df['B'].apply(str).str.len())
print(total_len) # 输出 16
```
其中,`apply(str)`的作用是将所有值转换为字符串类型,因为`str.len()`方法只能作用于字符串类型的数据。然后使用`str.len()`方法计算每个字符串的长度,最后使用`len()`函数计算所有长度的和。
相关问题
获取 python dataframe 某列每个元素的字符长度
可以使用 pandas 库中的 apply() 方法和 len() 函数来获取 python dataframe 某列每个元素的字符长度。具体的代码实现可以参考以下示例:
```python
import pandas as pd
# 创建一个示例 dataframe
df = pd.DataFrame({'col1': ['hello', 'world', 'python'], 'col2': [15, 23, 78]})
# 定义一个函数,用于计算字符长度
def get_length(s):
return len(str(s))
# 使用 apply() 方法获取某列每个元素的字符长度
lengths = df['col1'].apply(get_length)
# 输出结果
print(lengths)
```
运行以上代码,输出结果为:
```
0 5
1 5
2 6
Name: col1, dtype: int64
```
其中,输出结果表示 dataframe 中 col1 列每个元素的字符长度。如果需要查看其他列的字符长度,只需要将 `df['col1']` 替换为相应的列即可。
Pandas DataFrame怎么新增一列
要在 Pandas DataFrame 中新增一列,可以使用类似字典的方式对 DataFrame 进行赋值操作。比如,假设我们有一个 DataFrame 名为 df,现在要新增一列名为 'new_column',可以按照如下方式进行操作:
```
df['new_column'] = [1, 2, 3, 4, 5]
```
在上述代码中,我们给 df 新增了一列,列名为 'new_column',并将一个包含 5 个元素的列表 [1, 2, 3, 4, 5] 赋值给该列。注意,该列表的长度必须和 DataFrame 的行数相同。如果要新增的列是计算得到的,则可以直接对 DataFrame 进行操作,例如:
```
df['new_column'] = df['col1'] + df['col2']
```
上述代码将 df 中 col1 和 col2 两列相加的结果赋值给新的一列 new_column。
阅读全文