import numpy as np import struct def reading_train_data(index):# 训练集 ''' :param index: 读文件的序号 :return: 每个文件的向量与标签 ''' file = open("data/train/f" + str(index) + ".dat", "rb") data_raw = struct.unpack('f' * 144 * 440, file.read(4 * 144 * 440)) file.close() res_data = [] for i in range(0, 144): temp = [] for j in range(0, 440): temp.append(data_raw[i * 440 + j]) res_data.append(temp) res_data = np.array(res_data) lables = [] for i in range(0,144): lables.append(index) return res_data,lables def reading_test_data(index):# 测试集 ''' :param index: 读文件的序号 :return: 每个文件的向量与标签 ''' file = open("data/test/f" + str(index) + ".dat", "rb") data_raw = struct.unpack('f' * 18 * 440, file.read(4 * 18 * 440)) file.close() res_data = [] for i in range(0, 18): temp = [] for j in range(0, 440): temp.append(data_raw[i * 440 + j]) res_data.append(temp) res_data = np.array(res_data) lables = [] for i in range(0,18): lables.append(index) return res_data,lables
时间: 2023-07-15 11:14:31 浏览: 40
这段代码是用于读取训练集和测试集的数据。其中,训练集和测试集的数据都是以二进制文件的形式存储的,需要使用struct库中的unpack函数将其解压成浮点数数组。每个文件都包含了多个向量,每个向量的长度都为440。对于每个向量,将其存储为一个大小为(1, 440)的numpy数组。同时,每个向量都有一个对应的标签,标签的值为读文件的序号。最终,返回的是一个由多个向量和对应标签组成的元组列表。
相关问题
from math import * import numpy as np # 计算街区距离 def i_city_dist(x, y): #请在此处完成街区距离计算函数
好的,以下是街区距离计算函数:
```python
def i_city_dist(x, y):
return sum(abs(a-b) for a, b in zip(x, y))
```
这个函数的输入是两个向量 x 和 y,输出是它们之间的街区距离。具体来说,对于每个维度上的差值取绝对值,然后将所有维度上的绝对值之和作为距离。这个距离度量方式也叫曼哈顿距离。
import numpy as np class LinearReg(object): def __init__(self, indim=1, outdim=1):
### 回答1:
self.indim = indim
self.outdim = outdim
self.w = np.zeros((indim, outdim))我们可以使用numpy中的“zeros”方法,将LinearReg类中的权重(w)设置为零向量,以表示输入维度和输出维度。
### 回答2:
import numpy as np
class LinearReg(object):
def __init__(self, indim=1, outdim=1):
# 初始化线性回归模型参数
self.w = np.zeros((outdim, indim)) # 初始化权重参数为零行向量
self.b = np.zeros((outdim, 1)) # 初始化偏置参数为零向量
def forward(self, x):
# 前向传播
y_pred = np.dot(self.w, x) + self.b
return y_pred
def loss(self, y_true, y_pred):
# 计算损失
loss_val = np.mean((y_true - y_pred)**2)
return loss_val
def backward(self, x, y_true, y_pred):
# 反向传播,更新参数
m = x.shape[1] # 样本数量
dw = (-2 / m) * np.dot((y_true - y_pred), x.T) # 计算权重参数偏导数
db = (-2 / m) * np.sum(y_true - y_pred) # 计算偏置参数偏导数
self.w -= dw # 更新权重参数
self.b -= db # 更新偏置参数
def train(self, x, y_true, epochs=100, learning_rate=0.01):
# 训练模型
for epoch in range(epochs):
y_pred = self.forward(x) # 前向传播,得到预测值
loss_val = self.loss(y_true, y_pred) # 计算损失
self.backward(x, y_true, y_pred) # 反向传播,更新参数
# 输出当前训练轮次和对应的损失值
print('Epoch: {}/{}, Loss: {}'.format(epoch+1, epochs, loss_val))
def predict(self, x):
# 对输入样本进行预测
y_pred = self.forward(x)
return y_pred
### 回答3:
`import numpy as np`
`class LinearReg(object):`
这段代码首先导入了numpy库,并将其命名为np。这个库是用来进行科学计算和数据分析的。然后定义了一个类`LinearReg`。类是一种编程方式,用于封装数据和方法,并可以创建类的实例对象。
`def __init__(self, indim=1, outdim=1):`
这个代码段定义了`LinearReg`类的初始化方法`__init__`。这个方法是在创建类的实例对象时自动调用的。在这个方法中,使用`self`关键字来表示类的实例对象。
`self`参数是用来传入实例对象本身的,类中的其他方法可以通过`self`来访问实例对象的属性和方法。`__init__`方法中的`indim=1`和`outdim=1`是定义了两个参数`indim`和`outdim`的默认值,这两个参数分别表示输入维度和输出维度。
该`LinearReg`类的初始化方法是用来初始化类的实例对象的属性和状态。在这个方法中可以完成一些初始化操作,例如设置默认参数值,创建实例对象的属性等。