简单上手sklearn机器学习支持向量机
时间: 2024-12-17 13:37:19 浏览: 3
支持向量机(Support Vector Machine,SVM)是一种监督学习模型,在分类和回归问题中非常有效。在scikit-learn库中,安装并上手SVM是相对简单的。以下是步骤:
1. **安装依赖**:
首先确保已安装了Python及其基本科学计算库如NumPy、Pandas等,然后通过pip安装`scikit-learn`:
```shell
pip install scikit-learn
```
2. **导入模块**:
使用import语句导入所需的模块:
```python
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
```
3. **加载数据集**:
示例性地,你可以从scikit-learn自带的数据集中选择一个,如鸢尾花(Iris)数据集:
```python
iris = datasets.load_iris()
X = iris.data
y = iris.target
```
4. **划分训练集和测试集**:
这样可以评估模型在未见过的数据上的性能:
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
5. **创建并训练模型**:
使用`SVC`类创建一个线性核的支持向量机,并进行训练:
```python
svm = SVC(kernel='linear') # 或者尝试其他核函数如'rbf'
svm.fit(X_train, y_train)
```
6. **预测和评估**:
对测试集进行预测,然后计算准确率:
```python
y_pred = svm.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")
```
7. **调整参数**:
SVM有很多参数需要调整以优化模型性能,例如C参数和gamma。你可以使用GridSearchCV或其他交叉验证方法来寻找最佳参数组合。
阅读全文