首页sql.dataframe中有一列的数据类型为array，如何统计该列的每一行的数组的长度

sql.dataframe中有一列的数据类型为array，如何统计该列的每一行的数组的长度

时间: 2023-03-29 21:04:15 浏览: 281

您可以使用pyspark.sql.functions.size()函数来获取数组列中每个元素的长度，示例如下： ```python from pyspark.sql.functions import size df.select(size(df.array_column)).show() ``` 其中，df为您的DataFrame对象，array_column为您的数组列名。这将返回一个新的DataFrame，其中包含每行数组的长度。

阅读全文