pyspark shell中,parsedTrainingData = trainingData.map(lambda line: array([float(x) for x in line.strip().split(' ')]))。运行parsedTrainingData.collect。显示name array is not defined
时间: 2023-12-03 17:46:53 浏览: 89
这个错误提示表明你没有导入所需的模块或变量。请检查你的代码,确保在使用`array`时已经正确地导入了`numpy`模块。你可以在代码开头添加以下行来导入`numpy`:
```
import numpy as np
```
这样你就可以使用`np.array`来创建数组了。修改后的代码如下:
```
import numpy as np
parsedTrainingData = trainingData.map(lambda line: np.array([float(x) for x in line.strip().split(' ')]))
print(parsedTrainingData.collect())
```
注意,因为这里使用了`np.array`而不是`array`,所以在`lambda`函数中也需要相应地修改。
阅读全文