DataFrame' object has no attribute 'select_dtypes
时间: 2023-06-22 22:22:43 浏览: 460
从列表或字典创建Pandas的DataFrame对象的方法
`select_dtypes()`是pandas中的函数,而不是pyspark中的函数。在pyspark中,要选择特定的数据类型列,可以使用`filter()`和`cast()`函数,以下是一个示例代码:
```python
# 选择所有类型为整数的列
int_cols = [c[0] for c in df.dtypes if c[1].startswith('int')]
int_df = df.select([col(c).cast("integer") for c in int_cols])
# 选择所有类型为浮点数的列
float_cols = [c[0] for c in df.dtypes if c[1].startswith('float')]
float_df = df.select([col(c).cast("float") for c in float_cols])
```
其中,`df.dtypes`返回一个由列名和对应数据类型组成的元组列表,`startswith()`函数用于判断数据类型是否以指定的前缀开头。`select()`函数用于选择指定的列,`cast()`函数用于将列的数据类型转换成指定的类型。
阅读全文