# hyperparameters len_seq = 200 len_out = 114 stride = 1 learning_rate = 0.000005 batch_size = 4 n_layers = 4 hidden_dim = 256 train_epochs = 4
时间: 2023-10-09 13:08:55 浏览: 74
gpr.rar_GPR 高斯过程_gpr matlab_matlab gpr_高斯回归过程_高斯过程
好的,您的第一个问题是关于ChitGPT的超参数设置。ChitGPT使用的超参数包括输入序列的长度(len_seq)为200,输出序列的长度(len_out)为114,步幅(stride)为1,学习率(learning_rate)为0.000005,批大小(batch_size)为4,层数(n_layers)为4,隐藏维度(hidden_dim)为256,训练轮数(train_epochs)为4。
阅读全文