data = np.vstack((data, file[key][0:240000].reshape((raw_num,col_num))))
时间: 2023-12-27 20:02:33 浏览: 32
这行代码的作用是将一个字典中的值取出来,进行reshape操作后,垂直堆叠到一个numpy数组中。其中,file是一个字典,key是字典中的键,[0:240000]表示取字典中的值的前240000个元素,reshape操作将这些元素重塑为(raw_num,col_num)的矩阵形式。最后,np.vstack函数将这个矩阵和之前的矩阵按垂直方向堆叠在一起,形成一个更大的numpy数组data。
相关问题
import scipy.io as sio from sklearn import svm import numpy as np import matplotlib.pyplot as plt data=sio.loadmat('AllData') labels=sio.loadmat('label') print(data) class1 = 0 class2 = 1 idx1 = np.where(labels['label']==class1)[0] idx2 = np.where(labels['label']==class2)[0] X1 = data['B007FFT0'] X2 = data['B014FFT0'] Y1 = labels['label'][idx1].reshape(-1, 1) Y2 = labels['label'][idx2].reshape(-1, 1) ## 随机选取训练数据和测试数据 np.random.shuffle(X1) np.random.shuffle(X2) # Xtrain = np.vstack((X1[:200,:], X2[:200,:])) # Xtest = np.vstack((X1[200:300,:], X2[200:300,:])) # Ytrain = np.vstack((Y1[:200,:], Y2[:200,:])) # Ytest = np.vstack((Y1[200:300,:], Y2[200:300,:])) # class1=data['B007FFT0'][0:1000, :] # class2=data['B014FFT0'][0:1000, :] train_data=np.vstack((X1[0:200, :],X2[0:200, :])) test_data=np.vstack((X1[200:300, :],X2[200:300, :])) train_labels=np.vstack((Y1[:200,:], Y2[:200,:])) test_labels=np.vstack((Y1[200:300,:], Y2[200:300,:])) ## 训练SVM模型 clf=svm.SVC(kernel='linear', C=1000) clf.fit(train_data,train_labels.reshape(-1)) ## 用测试数据测试模型准确率 train_accuracy = clf.score(train_data, train_labels) test_accuracy = clf.score(test_data, test_labels) # test_pred=clf.predict(test_data) # accuracy=np.mean(test_pred==test_labels) # print("分类准确率为:{:.2F}%".fromat(accuracy*100)) x_min,x_max=test_data[:,0].min()-1,test_data[:,0].max()+1 y_min,y_max=test_data[:,1].min()-1,test_data[:,1].max()+1 xx,yy=np.meshgrid(np.arange(x_min,x_max,0.02),np.arange(y_min,y_max,0.02)) # 生成一个由xx和yy组成的网格 # X, Y = np.meshgrid(xx, yy) # 将网格展平成一个二维数组xy xy = np.vstack([xx.ravel(), yy.ravel()]).T # Z = clf.decision_function(xy).reshape(xx.shape) # z=clf.predict(np.c_[xx.ravel(),yy.ravel()]) z=xy.reshape(xx.shape) plt.pcolormesh(xx.shape) plt.xlim(xx.min(),xx.max()) plt.ylim(yy.min(),yy.max()) plt.xtickes(()) plt.ytickes(()) # # 画出分界线 # axis.contour(X, Y, Z, colors='k', levels=[-1, 0, 1], alpha=0.5, linestyles=['--', '-', '--']) # axis.scatter(clf.support_vectors_[:, 0], clf.support_vectors_[:, 1], s=100,linewidth=1, facecolors='none') plt.scatter(test_data[:,0],test_data[:1],c=test_labels,cmap=plt.cm.Paired) plt.scatter(clf.support_vectors_[:,0],clf.support_vectors_[:,1],s=80,facecolors='none',linewidths=1.5,edgecolors='k') plt.show()处理一下代码出错问题
代码中出现了几个错误:
1. 在最后几行代码中,plt.pcolormesh(xx.shape)应该改为plt.pcolormesh(xx, yy, z),因为需要绘制的是网格xy上对应的值z。
2. 在plt.xtickes(())和plt.ytickes(())中,xtickes和ytickes应该改为xticks和yticks,因为正确的函数名是xticks和yticks。
3. 在plt.scatter(test_data[:,0],test_data[:1],c=test_labels,cmap=plt.cm.Paired)中,test_data[:,0]和test_data[:1]应该改为test_data[:,0]和test_data[:,1],因为需要绘制的是测试数据的两个特征值。
4. 在画出分界线的代码中,应该将注释的代码取消注释,即将axis.contour(X, Y, Z, colors='k', levels=[-1, 0, 1], alpha=0.5, linestyles=['--', '-', '--'])的注释去掉。
test_path = "stock_daily/8/stock_test.csv" with open(test_path) as f: self.data = np.loadtxt(f, delimiter=",") # addi=np.zeros((self.data.shape[0],1)) # self.data=np.concatenate((self.data,addi),axis=1) self.data = self.data[:, 0:6] # self.data = np.vstack((self.data1, self.data[:, 4])) for i in range(len(self.data[0])): self.data[:, i] = (self.data[:, i] - mean_list[i]) / (std_list[i] + 1e-8) self.value = torch.rand(self.data.shape[0] - SEQ_LEN, SEQ_LEN, self.data.shape[1]) self.label = torch.rand(self.data.shape[0] - SEQ_LEN, 1) for i in range(self.data.shape[0] - SEQ_LEN): self.value[i, :, :] = torch.from_numpy(self.data[i:i + SEQ_LEN, :].reshape(SEQ_LEN, self.data.shape[1])) self.label[i, :] = self.data[i + SEQ_LEN, 0] self.data = self.value
这段代码是一个数据预处理的过程,首先从指定路径读取测试数据,然后将读取的数据进行归一化处理,接着将处理后的数据按照指定的时间序列长度(SEQ_LEN)切分成多个小数据集(value),同时对应的标签(label)为每个小数据集的最后一个时间点的数据。最后将处理后的数据存储在self.data中。这个过程是为了将原始的数据转化为神经网络可以接受的形式,以便进行训练和预测。
阅读全文