如何使用 joblib.dump() 函数保存模型
时间: 2024-02-20 22:01:11 浏览: 319
使用joblib.dump()函数保存模型非常简单,只需要将要保存的模型对象和保存文件的路径作为参数传递给该函数即可。示例如下:
```python
from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier
import joblib
# 加载 iris 数据集
iris = load_iris()
X, y = iris.data, iris.target
# 训练随机森林模型
rf = RandomForestClassifier()
rf.fit(X, y)
# 保存模型
joblib.dump(rf, 'rf_model.pkl')
```
在这个示例中,我们首先加载了 iris 数据集,然后训练了一个随机森林模型。最后,我们使用 joblib.dump() 函数将训练好的模型保存到了 rf_model.pkl 文件中。
需要注意的是,joblib.dump() 函数默认使用的压缩级别为 3,可以通过 compress 参数设置压缩级别。如果不需要压缩模型,可以将 compress 参数设置为 0。此外,如果要在保存模型时指定自定义的协议版本,可以通过 protocol 参数进行设置。例如,要使用 Python 3.8 版本的协议,可以将 protocol 参数设置为 5。
```python
# 保存模型并指定压缩级别和协议版本
joblib.dump(rf, 'rf_model.pkl', compress=0, protocol=5)
```
在实际应用中,为了防止模型被恶意篡改或损坏,建议对保存的模型文件进行数字签名或加密保护。
阅读全文