Spark MLlib线性回归算法
时间: 2023-06-21 11:21:03 浏览: 114
Spark mllib 线性回归测试数据
5星 · 资源好评率100%
Spark MLlib提供了基于最小二乘法的线性回归算法。下面是一个简单的例子:
```python
from pyspark.ml.regression import LinearRegression
# 读取数据集
dataset = spark.read.format("libsvm").load("data/mllib/sample_linear_regression_data.txt")
# 划分训练集和测试集
training, test = dataset.randomSplit([0.7, 0.3])
# 创建线性回归模型
lr = LinearRegression(maxIter=10, regParam=0.3, elasticNetParam=0.8)
# 训练模型
model = lr.fit(training)
# 预测测试集
predictions = model.transform(test)
# 打印结果
predictions.show()
```
在这个例子中,我们使用`LinearRegression`类来创建一个线性回归模型。我们还指定了最大迭代次数(maxIter)、正则化参数(regParam)和弹性网络参数(elasticNetParam)。然后我们使用训练集来训练模型,并使用测试集来评估模型的表现。最后,我们打印出预测结果。
阅读全文