Keras迁移模型参数：不同输入尺寸的实例

122 浏览量更新于2024-09-01 1 收藏 90KB PDF 举报

本文将详细介绍如何在Keras中有效地读取训练好的模型参数，并将其应用于其他模型。Keras是一个流行的深度学习库，其模型参数管理对于迁移学习和复用预训练模型至关重要。本文首先探讨了官方文档中提供的方法，即通过`Model`对象的`get_layer`函数来获取训练模型特定层的输出，但遇到了输入维度不匹配的问题。在实际操作中，即使新模型的输入尺寸与训练模型不同，我们依然可以利用训练模型的参数。关键在于为新模型的每个层指定与原模型对应的名字。例如，如果你的训练模型有一层名为`conv2d_1`，那么在新模型中创建同样名称的`Conv2D`层时，就可以保留原有的参数。以下是一个具体的步骤： 1. 定义新模型时，使用`Input`层设置新模型的输入形状，然后为每一层添加名称。例如： ```python inputs = Input(shape=(400, 500, 3)) X = Conv2D(32, (3, 3), name="conv2d_1")(inputs) X = BatchNormalization(name="batch_normalization_1")(X) X = Activation('relu', name="activation_1")(X) ``` 2. 创建新模型时，确保在`Model`的构建函数中，指定`inputs`和`outputs`以及`by_name=True`参数，以便Keras根据层名正确地加载参数： ```python model = Model(inputs=inputs, outputs=X) model.load_weights('model_halcon_resenet.h5', by_name=True) ``` 通过这种方式，即使新模型的输入尺寸与训练模型不同，Keras仍能根据层名找到并应用相应的参数，从而实现了模型参数的迁移。这种方法对于调整网络结构或针对不同数据集微调预训练模型非常有用，只需稍作修改，就能让模型适应新的输入需求。同时，源代码中引用了Keras库中的功能，如`load_model`、`preprocess_input`等，这些都是在实际操作中必不可少的部分。总结来说，本文主要讲解了如何通过命名策略在Keras中实现训练模型参数的跨模型迁移，包括理解官方示例的局限性，以及如何在新模型中正确应用这些参数。通过这种方法，开发人员可以在保持模型性能的同时，灵活地调整网络结构，提高了深度学习项目的可重用性和效率。

keras读取训练好的模型参数并把参数赋值给其它模型详解读取训练好的模型参数并把参数赋值给其它模型详解

主要介绍了keras读取训练好的模型参数并把参数赋值给其它模型详解，具有很好的参考价值，希望对大家有所

帮助。一起跟随小编过来看看吧

介绍介绍

本博文中的代码，实现的是加载训练好的模型model_halcon_resenet.h5，并把该模型的参数赋值给两个不同的新的model。

函数式模型函数式模型

官网上给出的调用一个训练好模型，并输出任意层的feature。

model = Model(inputs=base_model.input, outputs=base_model.get_layer(‘block4_pool').output)

但是这有一个问题，就是新的model，如果输入inputs和训练好的model的inputs大小不同呢？比如我想建立一个输入是

600x600x3的新model，但是训练好的model输入是200x200x3，而这时我又想调用训练好模型的卷积核参数，这时该怎么办

呢？

其实想一下，用训练好的模型参数，即使输入的尺寸不同，但是这些模型参数仍然可以处理计算，只是输出的feature map大

小不同。那到底怎么赋值呢？其实很简单

在定义新的model时，新的model层在定义时，需要加上名字，而这个名字就是训练好的模型的每层名字。如下代码所示：

inputs=Input(shape=(400,500,3))

X=Conv2D(32, (3, 3),name=“conv2d_1”)(inputs)

X=BatchNormalization(name=“batch_normalization_1”)(X)

X=Activation(‘relu',name=“activation_1”)(X)

最后通过以下代码即可建立一个新的模型并拥有训练好模型的参数：

model=Model(inputs=inputs, outputs=X)

model.load_weights(‘model_halcon_resenet.h5', by_name=True)

源代码源代码

from keras.models import load_model

from keras.preprocessing import image

from keras.applications.vgg19 import preprocess_input

from keras.models import Model

import numpy as np

from keras.layers import Conv2D, MaxPooling2D,merge

from keras.layers import BatchNormalization,Activation

from keras.layers import Input, Dense

from PIL import Image

import numpy as np

import keras

from keras.models import Sequential

from keras.layers import Dense, Dropout, Flatten,Input

from keras.layers import Conv2D, MaxPooling2D,merge,AveragePooling2D,GlobalAveragePooling2D

from keras.layers import BatchNormalization,Activation

from sklearn.model_selection import train_test_split

from keras.applications.densenet import DenseNet169, DenseNet121

from keras.applications.inception_resnet_v2 import InceptionResNetV2

from keras.applications.inception_v3 import InceptionV3

from keras.optimizers import SGD

from keras import regularizers

from keras.models import Model

import tensorflow as tf

from PIL import Image

from keras.callbacks import TensorBoard

import os

import cv2

from keras import backend as K

from model import focal_loss

import keras.losses

#ReadMe 该代码是参考fast rcnn系列，先对整幅图像提取特征feature map，然后从原图对应位置上映射到feature map，并对feature map进行

# 切片，从而提取对应某个位置上的特征，并把该特征送进后面的识别网络进行分类识别。

keras.losses.focal_loss = focal_loss#这句代码是为了引入定义的loss

base_model=load_model('model_halcon_resenet.h5')

base_model.summary()

inputs=Input(shape=(400,500,3))

X=Conv2D(32, (3, 3),name="conv2d_1")(inputs)

X=BatchNormalization(name="batch_normalization_1")(X)

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38599537

粉丝: 8
资源: 922

Keras迁移模型参数：不同输入尺寸的实例

使用Keras预训练好的模型进行目标类别预测详解

keras预测训练好的模型

keras预测训练好的模型.rar

C++ 从 HDF5 文件读取 Keras 神经网络模型和参数

keras 两种训练模型方式详解fit和fit_generator(节省内存)

Keras预训练模型综合对比

VGG16 keras 预训练模型

Keras预训练模型.zip

Keras YOLO训练流程详解：深入理解模型训练过程

YOLO小目标检测：Keras模型训练与评估指南，入门Keras，轻松构建模型

最新资源