用python写一段机器学习代码:我已有一个训练集文件和测试集文件,这两个文件都是csv文件,请用knn算法对训练集文件进行模型训练,并用测试集文件测试模型准确性并输出。
时间: 2024-01-25 11:04:54 浏览: 21
好的,以下是一段 Python 代码,使用 KNN 算法对训练集文件进行模型训练,并用测试集文件测试模型准确性并输出:
```python
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
# 读取训练集文件和测试集文件
train_data = pd.read_csv('train.csv')
test_data = pd.read_csv('test.csv')
# 将数据拆分为特征和标签
train_features = train_data.iloc[:, :-1]
train_labels = train_data.iloc[:, -1]
test_features = test_data.iloc[:, :-1]
test_labels = test_data.iloc[:, -1]
# 使用 KNN 算法进行模型训练
k = 3 # 设置 K 值
knn = KNeighborsClassifier(n_neighbors=k)
knn.fit(train_features, train_labels)
# 使用测试集文件测试模型准确性并输出
predicted_labels = knn.predict(test_features)
accuracy = accuracy_score(test_labels, predicted_labels)
print(f"KNN 模型在测试集上的准确性为:{accuracy}")
```
其中,train.csv 和 test.csv 分别是训练集文件和测试集文件的文件名,注意将代码中的文件名改为你实际使用的文件名。K 值是 KNN 算法中的参数,这里设置为 3,你可以根据需要调整此值。输出结果会显示 KNN 模型在测试集上的准确性。