Huffman压缩与解压缩实现及设计思路

需积分: 0 186 浏览量更新于2024-08-05 收藏 6.27MB PDF 举报

"PB20020599_杨涛_lab021 - Huffman压缩报告" 这篇报告主要涉及的是使用Huffman编码实现文件的压缩和解压缩。Huffman编码是一种基于频率的无损数据压缩算法，它通过构建一棵权值为字符频率的二叉树来生成具有短路径长度的编码，从而达到压缩数据的目的。实验要求主要包括以下几点： 1. 实现一个既能压缩又能解压缩的程序，用户可以选择压缩或解压缩指定路径的文件。 2. 程序可以通过命令行参数、GUI界面或用户交互方式来指定功能和输入/输出文件路径，但不允许直接修改源代码来指定这些参数。 3. 压缩文件不需要指定解压缩的目标路径，解压缩时也不需要指定原始文件的路径。 4. 程序需要能够处理任意基本符号单元大小的Huffman编码，不仅限于字节，最小单位可以为0.5个字节。设计思路分为压缩和解压缩两部分： - 压缩过程：根据用户指定的单元大小（iBits），创建相应数量的树节点指针。遍历文件，对每个单元统计其出现频率，然后根据频率构造Huffman树。使用`std::sort`进行降序排序，将两个最低频率的节点合并，直到只剩下一个节点，即为Huffman树根节点。生成的Huffman编码将写入压缩文件。 - 解压缩过程：读取压缩文件的Huffman编码和额外信息，重建Huffman树。然后，根据编码和树结构解码数据，恢复原始文件内容。在处理非字节基本符号单元时，可能遇到原文件大小不是基本符号单元大小整数倍的问题。为解决此问题，可以在压缩时将文件填充到基本符号单元的整数倍大小，并在文件头部存储填充信息，以便解压缩时能正确去除填充部分。在压缩和解压缩的时空复杂度分析中，通常压缩过程的时间复杂度与文件大小和基本符号单元大小有关，而空间复杂度则取决于生成的Huffman编码和辅助数据结构的大小。解压缩过程的时间复杂度主要与压缩后的文件大小和Huffman树的构建有关，空间复杂度主要涉及解压缩过程中的临时存储需求。代码测试应确保覆盖各种情况，包括不同大小的文件、不同基本符号单元以及各种字符分布的文件。实验总结部分会对实现的效果、效率和可能存在的问题进行评估。附录可能包含更详细的算法实现细节、额外的数据分析和可能的优化建议。

头文件Huffman.h

主要的是树节点的构造，主要参数有左右孩子，权重，该节点对应的原来的单元，以及该节点对应的

压缩后对应的01码 s

而方法则主要是读取参数与设定参数

class TreeNode

{

private:

Tpointer lchild; //取0

Tpointer rchild; //取1

cnt weight;

Tpointer data; //原压缩文件所对应的基础单元,用整数表示

string s;

public:

static int iBits;//存储的原定单元bit个数iBits

TreeNode()

{

lchild = -1;

rchild = -1;

weight = 0;

data = 0;

}

TreeNode(Tpointer l,Tpointer r,Tpointer d)

{

lchild = l;

rchild = r;

data = d;

}

cnt W() { return weight; }

void setW(cnt wt){weight=wt;}

Tpointer lch() { return lchild; }

Tpointer rch() { return rchild; }

Tpointer d() { return data; }

void setChild(Tpointer l, Tpointer r)

{

lchild = l; //0为空，或者是头结点

rchild = r;

}

void operator++() { weight++; }

void SetData(Tpointer d) { data = d; }

static void print(TreeNode *list[]); //打印子树

const string& sout(){return s;}

void sets(string &sin){s=sin;}

};

Compression

下面是压缩函数，需要注意的是此时主函数已经处理iBits的输出

剩余12页未读，继续阅读

郑瑜伊

粉丝: 23
资源: 317

Huffman压缩与解压缩实现及设计思路

PB20020599_杨涛_lab011

便携式无创数字脉搏血氧仪的设计研究_杨涛.caj

杨涛老师MvcPager-ajax单个、多个分页

推荐几篇入门变形网格的中文文献

什么书籍包含node.js和PHP和python用中文展示

国内Python算法书籍

gec6818视频点播器毕业设计的10条参考文献

数据运营的书籍有哪些

杨涛：中国城市自行车交通的捍卫与救赎.pdf

虚拟机的设计与实践-C_C++[中译文] _ [美]布朗登 著; 杨涛 等译

最新资源

虚拟机的设计与实践-C_C++[中译文] _ [美]布朗登著; 杨涛等译