首页pyspark shell中，parsedTrainingData = trainingData.map(lambda line: array([float(x) for x in line.strip().split(' ')]))。运行parsedTrainingData.collect。显示name array is not defined

pyspark shell中，parsedTrainingData = trainingData.map(lambda line: array([float(x) for x in line.strip().split(' ')]))。运行parsedTrainingData.collect。显示name array is not defined

时间: 2023-12-03 17:46:53 浏览: 89

这个错误提示表明你没有导入所需的模块或变量。请检查你的代码，确保在使用`array`时已经正确地导入了`numpy`模块。你可以在代码开头添加以下行来导入`numpy`： ``` import numpy as np ``` 这样你就可以使用`np.array`来创建数组了。修改后的代码如下： ``` import numpy as np parsedTrainingData = trainingData.map(lambda line: np.array([float(x) for x in line.strip().split(' ')])) print(parsedTrainingData.collect()) ``` 注意，因为这里使用了`np.array`而不是`array`，所以在`lambda`函数中也需要相应地修改。

阅读全文