sklearn存储模型
时间: 2023-09-05 22:07:52 浏览: 103
关于Tensorflow 模型持久化详解
在 scikit-learn 中,使用 `joblib` 模块来存储模型。`joblib` 模块是一个在 Python 中用于序列化和反序列化 Python 对象的库,它可以有效地存储大型 NumPy 数组和其他类型的科学数据结构。
以下是使用 `joblib` 模块存储 scikit-learn 模型的示例代码:
```python
from sklearn.externals import joblib
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression
# 加载 iris 数据集
iris = load_iris()
# 训练逻辑回归模型
clf = LogisticRegression()
clf.fit(iris.data, iris.target)
# 存储模型
joblib.dump(clf, 'logistic_regression.pkl')
```
上述代码使用 `joblib.dump()` 函数将训练好的逻辑回归模型存储为名为 `logistic_regression.pkl` 的文件。
要加载模型并进行预测,可以使用以下代码:
```python
# 加载模型
clf = joblib.load('logistic_regression.pkl')
# 进行预测
clf.predict(iris.data)
```
上述代码使用 `joblib.load()` 函数加载之前存储的模型,并使用它进行预测。
阅读全文