TensorFlow网络模型压缩：量化与剪枝实践

需积分: 0 152 浏览量更新于2024-06-30 收藏 2.25MB DOCX 举报

"AI2019_SA19225404_吴语港_Lab4_TF1.x1" 本实验报告聚焦于利用TensorFlow实现深度学习模型的压缩，特别是通过剪枝和量化技术。学生吴语港在2019年11月6日进行了这项实验，地点位于思贤楼301303实验室。剪枝（Pruning）剪枝是减少神经网络模型复杂度的一种有效方法，主要目的是删除那些对网络性能影响较小的参数。它包括正则化、修剪和增长等策略。正则化通过调整目标函数来鼓励更稀疏的参数解；修剪则直接删除多余的特征和参数；而增长则是从小型网络开始，逐渐增加结构。剪枝的实施通常包含以下步骤：评估神经元的重要性、删除不重要的神经元、微调网络、并重复这个过程。关键挑战包括确定剪枝的粒度、选择合适的剪枝方法、权值重要性的度量、去除的权值数量或比例的决定、何时进行剪枝以及在finetune后如何处理新产生的不重要权值。量化（Quantization）量化是另一种模型压缩技术，它通过降低参数的精度来减少模型的存储需求。传统的神经网络参数通常使用32位浮点数表示，但许多情况下并不需要这么高的精度。通过量化，可以将这些参数表示为更短的位数，如8位甚至更低。例如，SGD在保持精度的同时，只需要6到8位的精度。量化策略包括二值量化、三值量化和多值量化。二值网络（如XNOR网络）通过使用1位表示权重和输入，既减小了模型大小，又通过位运算替代复杂的卷积操作，提高了执行速度。然而，二值网络可能导致模型表达能力下降，因此研究者开始探索n位编码以维持模型的复杂性和性能。实验目标是通过剪枝和量化来实现TensorFlow网络的压缩，从而减少模型的存储需求和提高运行效率。实验中可能涉及了如何有效地执行这些技术，如权重的量化方法、计算二值权重梯度的策略以及保证量化后模型精度的方法。这是一次深入理解深度学习模型压缩原理和实践的重要实践，对于提升模型的部署效率具有重要意义。

蒸馏模型采用的是迁移学习，通过采用预先训练好的复杂模型（Teacher

model）的输出作为监督信号去训练另外一个简单的网络。这个简单的网络称之

为 student model。

总体的来说，知识蒸馏是一种迁移学习，将大模型的知识最大程度的教授

给小模型，以达到压缩模型的目的。目前来看，无论是压缩比还是蒸馏后的性

能都还有待提高。

存在的问题和研究的趋势，如何处理“知识”的不同形式，去除 softmax

的限制，研究趋向于选用中间特征层。如何选择特征层，如何设计损失函数。

训练学生模型数据集的选择，以及学生模型的设计。如何和其他压缩方法集

成。

三、实验过程:

（1）普通训练：

导入 tensorflow，numpy 使用 keras 来搭建模型

通过 keras 自带的 mnist 数据集，导入为训练集与测试集

对数据进行归一化处理为 0~1 区间，查看数据的形状，一共有 60000 个

训练样本，10000 个测试样本，每个图片为 28x28 的灰度图片。

使用 onehot 编码对输出标签分类，建立了实验二当中使用的一个卷积神

经网络

剩余15页未读，继续阅读

葡萄的眼泪

粉丝: 21

TensorFlow网络模型压缩：量化与剪枝实践

"基于RNN-LSTM CTC的变长字符串识别实践报告

Intel-Caffe第三方库MKLML_LNX_2019.0.3.20190220使用指南

AI109B_GM.DLL缺失解决方案与修复指南

AI2019_SA19225404_吴语港_Lab2_TF1.x1

AI2019_SA19225404_吴语港_Lab3_TF1.x1

哈工大人工智能实验_hit_ai_lab.zip

SYSU_RYH_人工智能实验_2019-Fall-AI-LAB.zip

80-pe986-1_t_sa8155_sa8150_sa8155p_sa8150p_device_specification

80-pe986-5a_j_sa8195_sa8155_sa6155_qam8195_qam8155_chipset_intro

2018秋哈工大人工智能实验_AI-Lab.zip

最新资源