机器学习项目实战代码
时间: 2024-06-11 19:02:31 浏览: 210
机器学习项目实战代码通常包括数据处理、模型训练和评估三个部分。以下是一个简单的例子,介绍了如何使用Python实现一个二分类模型。
1. 数据处理:
数据处理是机器学习项目中非常重要的一步,可以使用Pandas等数据处理库进行数据清洗、特征工程等操作。
```python
import pandas as pd
import numpy as np
# 读取数据
data = pd.read_csv('data.csv')
# 数据清洗
data.dropna(inplace=True)
# 特征工程
X = data.iloc[:, :-1]
y = data.iloc[:, -1]
```
2. 模型训练:
在模型训练之前,需要将数据集划分为训练集和测试集,并选择适当的模型和超参数。
```python
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 选择模型并训练
model = LogisticRegression()
model.fit(X_train, y_train)
```
3. 模型评估:
模型评估通常包括精度、召回率、F1值等指标,可以使用sklearn等库进行计算。
```python
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
# 预测并评估模型
y_pred = model.predict(X_test)
acc = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred)
recall = recall_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred)
print('Accuracy: {:.2f}%'.format(acc * 100))
print('Precision: {:.2f}%'.format(precision * 100))
print('Recall: {:.2f}%'.format(recall * 100))
print('F1 Score: {:.2f}%'.format(f1 * 100))
```
阅读全文