dataframe相同列加count+1
时间: 2023-11-21 20:06:13 浏览: 73
可以使用 pandas 库中的 groupby 方法。假设要对 DataFrame 中的 "column_name" 列进行计数操作,则可以使用下面的代码:
df.groupby(['column_name']).size().reset_index(name='count')
其中 "column_name" 是要进行分组的列名,size() 方法用于计算每个组的大小,reset_index() 方法用于将结果转换为 DataFrame,并且为计数结果添加 "count" 列名。
相关问题
dataframe某列加和
要计算DataFrame中某一列的总和,你可以使用`.sum()`方法。这将返回该列的总和值。下面是一个示例:
```python
import pandas as pd
# 创建一个示例DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie', 'Dave', 'Eve'],
'Age': [25, 30, 35, 40, 45],
'Salary': [5000, 6000, 7000, 8000, 9000]}
df = pd.DataFrame(data)
# 计算'Salary'列的总和
total_salary = df['Salary'].sum()
print(total_salary)
```
输出结果:
```
35000
```
在这个示例中,我们使用了`df['Salary'].sum()`来计算'Salary'列的总和,并将结果存储在`total_salary`变量中。然后,我们打印了`total_salary`以查看结果。
优化这段代码:override def load(dataFrame: DataFrame, delta: Boolean): DataFrame = { val dataFrameCache=dataFrame.repartition(col("TRANSACTION_TYPE_CODE")) logger.info(s"Method Load execution start and data count is " + dataFrame.count()) val rbkFactTableLists: Seq[RbkFactTableEntity] = rbkConfigUtil.getRbkFactTableList(rbkConfig) logger.info(s"Method rbkFactTableLists is " + rbkFactTableLists.size) val rbkMainFactTable = rbkConfigUtil.getRbkMainFactTable(rbkConfig) logger.info(s"Method rbkMainFactTable is " + rbkMainFactTable) val rbkUnionFactTableList =rbkConfigUtil.getRbkUnionFactTableList(rbkConfig) logger.info(s"Method rbkUnionFactTableList is " + rbkUnionFactTableList.size) loadRbkMainData( dataFrameCache,false , rbkMainFactTable ) for(rbkUnionTable<-rbkUnionFactTableList) { loadRbkUnionData( dataFrameCache,false , rbkUnionTable ) } for(rbkFactTable <- rbkFactTableLists){ loadRbkData(dataFrameCache, false ,rbkFactTable) } logger.info(s"Method Load execution end and data count is " + dataFrame.count()) dataFrameCache }
override def load(dataFrame: DataFrame, delta: Boolean): DataFrame = {
val dataFrameCache = dataFrame.repartition(col("TRANSACTION_TYPE_CODE"))
val rbkFactTableLists: Seq[RbkFactTableEntity] = rbkConfigUtil.getRbkFactTableList(rbkConfig)
val rbkMainFactTable = rbkConfigUtil.getRbkMainFactTable(rbkConfig)
val rbkUnionFactTableList = rbkConfigUtil.getRbkUnionFactTableList(rbkConfig)
loadRbkMainData(dataFrameCache, false, rbkMainFactTable)
for (rbkUnionTable <- rbkUnionFactTableList) {
loadRbkUnionData(dataFrameCache, false, rbkUnionTable)
}
for (rbkFactTable <- rbkFactTableLists) {
loadRbkData(dataFrameCache, false, rbkFactTable)
}
dataFrameCache
}
优化建议:
1.减少不必要的日志记录。
2.尽可能使用 val 关键字。
3.使用更具有表现力和更易读的名称。
4.拆分复杂函数。
阅读全文
相关推荐
![-](https://img-home.csdnimg.cn/images/20241231045053.png)
![-](https://img-home.csdnimg.cn/images/20241231044930.png)
![-](https://img-home.csdnimg.cn/images/20241231044930.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![pdf](https://img-home.csdnimg.cn/images/20241231044930.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![pdf](https://img-home.csdnimg.cn/images/20241231044930.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)