如何用pandas做分布式计算
时间: 2023-03-20 18:02:32 浏览: 188
基于DolphinDB引擎的Orca:集成pandas API的分布式存储与计算设计源码
Pandas是一个Python库,可以用它来实现分布式计算。首先,可以使用Pandas的read_csv函数读取要处理的数据集,然后使用Pandas的groupby函数对数据集进行分组,再使用Pandas的apply函数对每个分组进行计算,最后使用Pandas的to_csv函数将计算结果保存到文件中。
阅读全文