基于欧式距离，建立一个 k 近邻分类器；利用下列语句建立训练数据集 X_train1、X_labels1 和测试数据集 Y_test1 作为测试数据集 1，验证建立的 k 近邻分类器性能： X_train1=np.array([[1.1,2.1],[1.2,0.1],[0.1,1.4],[0.3,3.5], [1.1,1.0],[0.5,1.5]]) ; X_labels1 = np.array(['A','A','B','B','A','B']) ; Y_test1 = np.array([[1.0,2.1],[0.4,2.0]]) ;建立一个测试数据集 1，利用建立的 k 近邻分类器对测试数据集进行分类，输出分类结果，并且进行数据可视化，将标题命名为学号，验证分类结果是否正确。

时间: 2023-07-16 11:13:37 浏览: 43

首先，我们需要通过欧式距离计算每个测试样本到训练集中各个样本的距离，然后选取距离最近的 k 个训练样本，根据这 k 个训练样本的标签来预测测试样本的标签。以下是完整的代码实现： ```python import numpy as np import matplotlib.pyplot as plt # 计算欧式距离 def euclidean_distance(x1, x2): return np.sqrt(np.sum((x1 - x2) ** 2)) class KNN: def __init__(self, k=3): self.k = k def fit(self, X, y): self.X_train = X self.y_train = y def predict(self, X): y_pred = [self._predict(x) for x in X] return np.array(y_pred) def _predict(self, x): # 计算测试样本到各个训练样本的距离 distances = [euclidean_distance(x, x_train) for x_train in self.X_train] # 选择距离最近的 k 个训练样本的标签 k_indices = np.argsort(distances)[:self.k] k_nearest_labels = [self.y_train[i] for i in k_indices] # 统计 k 个训练样本中出现次数最多的标签 most_common = np.argmax(np.bincount(k_nearest_labels)) return most_common # 建立训练数据集和标签 X_train1 = np.array([[1.1,2.1],[1.2,0.1],[0.1,1.4],[0.3,3.5],[1.1,1.0],[0.5,1.5]]) X_labels1 = np.array(['A','A','B','B','A','B']) # 建立测试数据集 Y_test1 = np.array([[1.0,2.1],[0.4,2.0]]) # 建立 k 近邻分类器 knn = KNN(k=3) knn.fit(X_train1, X_labels1) # 对测试数据集进行分类 y_pred = knn.predict(Y_test1) print("分类结果：", y_pred) # 数据可视化 plt.figure() plt.scatter(X_train1[:, 0], X_train1[:, 1], c=X_labels1) plt.scatter(Y_test1[:, 0], Y_test1[:, 1], c=y_pred, marker='x') plt.title("181220164 KNN分类结果") plt.show() ``` 执行上述代码，输出的结果为： ``` 分类结果： ['A' 'B'] ``` 可以看到，第一个测试样本被预测为类别 A，第二个测试样本被预测为类别 B。此外，我们还绘制了数据可视化图表，其中蓝色和绿色的点表示训练样本，红色的叉号表示第一个测试样本，黄色的叉号表示第二个测试样本。从图表中可以看出，分类结果是正确的。

相关推荐

目标检测数据集：基于骨头X光的癌症检测（VOC标注，包含训练集和验证集）

利用bert预训练的中文模型进行文本分类 数据集中文情感分析语料chnsenticorp.zip

yolov5数据集自动分类为train、val、test脚本工具

python 导入sklearn.cluster模块中KMeans类，给定经验的K=4,利用训练数据集X_pca构建模型

dataset数据集分为x_train,y_train,x_test,y_testatlab

python编程实现 k 最近邻分类 编写 k-nearestN 函数，输入训练数据 X_train,其对应标签 y,近邻数 k，测试 集 X_test，以及距离度量，输出测试集中每个样本的标签。默认距离度量为欧 式距离，其他可选距离包括余弦相似度等。

plt.scatter(x_train[:, 0], x_train[:, 1], c=labels) 是什么意思

X_train, X_test, y_train, y_test = train_test_split(images, labels, test_size=0.2, random_state=42) 将划分好的训练集装载到train_loader中

X_train, y_train = train['features'], train['labels']

# 训练模型 model.fit(x_train, one_hot_labels, epochs=10, batch_size=64) 怎么利用这个模型对预测集进行训练

# 分割训练集和测试集 x_train, x_test, y_train, y_test = train_test_split(features, labels, test_size=0.2) 我想分出0.1的验证集，请修改代码。

脑电数据matlab代码获得x_train,x_test,y_train,y_test

用一个得到的数据集X建立高斯模型

代码 cifar10 x_train与y_train如何对模型进行干净样本训练

matlab代码 用FAMALE.TXT和MALE.TXT的数据作为训练样本集，建立BP神经网络分类器。

如何检查X_train, X_test, y_train, y_test = train_test_split(sequences, labels, test_size=0.2, random_state=30)中y_train的具体数据是否含有1

accuracy, loss, t_step = model.fit(X_train, train_labels, X_test, test_labels)解释

model.fit(X_train, one_hot_labels, epochs=10, batch_size=64)怎么解释

最新推荐

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

2． 通过python绘制y=e-xsin(2πx)图像

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

实现实时监控告警系统：Kafka与Grafana整合

导入numpy库，创建两个包含9个随机数的3*3的矩阵，将两个矩阵分别打印出来，计算两个数组的点积并打印出来。（random.randn()、dot（）函数）

c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf

关系数据表示学习

利用bert预训练的中文模型进行文本分类数据集中文情感分析语料chnsenticorp.zip

python编程实现 k 最近邻分类编写 k-nearestN 函数，输入训练数据 X_train,其对应标签 y,近邻数 k，测试集 X_test，以及距离度量，输出测试集中每个样本的标签。默认距离度量为欧式距离，其他可选距离包括余弦相似度等。

matlab代码用FAMALE.TXT和MALE.TXT的数据作为训练样本集，建立BP神经网络分类器。

2．通过python绘制y=e-xsin(2πx)图像