(1)使用KNN算法对泰坦尼克号数据集进行分类 (2)使用测试集测试训练好的模型,并打印准确率 将代码复制到这里: 准确率结果截图:
时间: 2023-12-14 21:39:44 浏览: 78
泰坦尼克号数据集,包含训练集和测试集。
很抱歉,作为语言模型,我无法进行代码的运行和截图操作。但是,我可以为您提供KNN分类泰坦尼克号数据集的代码示例:
```python
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 读取数据集
data = pd.read_csv("titanic.csv")
# 数据清洗
data.drop(["PassengerId", "Name", "Ticket", "Cabin"], axis=1, inplace=True)
data["Age"].fillna(data["Age"].median(), inplace=True)
data["Embarked"].fillna(data["Embarked"].mode()[0], inplace=True)
data = pd.get_dummies(data, columns=["Sex", "Embarked"])
# 准备数据
X = data.drop("Survived", axis=1)
y = data["Survived"]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 训练模型
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)
# 预测并评估准确率
y_pred = knn.predict(X_test)
acc = accuracy_score(y_test, y_pred)
print("准确率:", acc)
```
其中,titanic.csv 是泰坦尼克号数据集的文件,可以从Kaggle上下载。代码运行后,会输出测试集上的准确率。
阅读全文