哈夫曼编码和译码的实验收获

时间: 2023-12-22 11:28:08 浏览: 101

哈弗曼编码与译码实验报告

1.构造哈夫曼树及哈夫曼编码：从终端读入字符集大小n、n个字符以及n个对应的权值，建立哈夫曼树；利用已经建好的哈夫曼树求每个叶结点的哈夫曼编码，并保存。 2．编码：利用已构造的哈夫曼编码对“明文”文件中的正文进行编码，然后将结果存入“密文”文件中。 3．译码：将“密文”文件中的0、1代码序列进行译码。 4．打印“密文”文件：将文件以紧凑格式显示在终端上，每行30个代码；同时，将此字符形式的编码文件保存。 5．打印哈夫曼树及哈夫曼编码：将已在内存中的哈夫曼树以凹入表形式显示在终端上，同时将每个字符的哈夫曼编码显示出来；并保存到文件。《哈弗曼编码与译码实验报告》\n\n哈弗曼编码是一种高效的数据压缩方法，主要用于提升信道利用率和减少信息传输时间。本实验旨在实现哈弗曼编码的构建、编码、译码过程，以及相关文件的处理功能。实验分为以下几个主要部分：\n\n1. 哈弗曼树的构造：从用户输入接收字符集大小n、n个字符及其对应的权值，然后根据这些信息构建哈夫曼树。哈夫曼树是一种特殊的二叉树，其中每个叶子节点代表一个字符，权值表示字符出现的频率。通过反复合并权值最小的两个节点，直至只剩下一个节点，即可得到哈夫曼树。\n\n2. 哈夫曼编码的生成：利用哈夫曼树，从叶子节点出发，沿着路径回到根节点，记录路径上的左右分支（0或1），形成字符的哈夫曼编码。编码时，从左到右的分支对应编码的低位，反之为高位。\n\n3. 编码过程：将“明文”文件中的字符按照哈夫曼编码转换成0、1序列，写入“密文”文件。这一阶段涉及字符与编码之间的映射操作，需要遍历整个文本。\n\n4. 译码过程：从“密文”文件中读取0、1序列，根据哈夫曼编码还原成原始字符，实现解码。\n\n5. 文件显示与保存：在终端上以紧凑格式显示“密文”文件，每行30个代码，同时保存编码文件。此外，还应展示哈夫曼树结构及其编码，以便于理解和检查。\n\n在模块设计中，使用结构体数组`hNode`存储哈夫曼树的节点信息，包括权值、父节点、左子节点和右子节点。而`hCode`结构体用于存储哈夫曼编码，包括编码字符串、起始位置和对应的字符。\n\n在详细设计阶段，需实现多个功能函数，如构建哈弗曼树、生成编码、编码文件、解码文件等。在调试过程中，可能会遇到诸如文件操作、参数传递、函数调用等问题，需要逐步解决。程序的时间复杂度主要包括哈夫曼树的构建（O(n^2)）、编码和解码（均为O(n^2)），其中n为叶子节点的数量。\n\n测试数据包括不同字符集和权值的组合，用于检验程序的正确性和适应性。例如，当叶子节点个数为4时，对应权值为{1,3,5,7}，字符集为{A,B,C,D}；当叶子节点个数为7时，权值为{12,6,8,18,3,20,2}，字符集为{A,B,C,D,E,F,G}。\n\n源代码中包含了相关的头文件和数据结构定义，以及函数声明和实现，以完成上述功能。通过不断调试和优化，确保程序能够正确地执行哈弗曼编码和译码，以及文件的读写操作，满足实验需求。

哈夫曼编码是一种可变长度编码，它通过将出现频率较高的字符用较短的编码表示，出现频率较的字符用较长的编码表示，从而达到压缩数据的目的。哈夫曼编码的实验收获如下： 1. 了解哈夫曼编码的原理和实现过程，包括构建哈夫曼树、生成编码表、编码和译码等步骤。 2. 掌握如何使用Python实现哈夫曼编码和译码，包括读取文件、统计字符频率、构建哈夫曼树、生成编码表、编码和译码等操作。 3. 理解哈夫曼编码的优点和局限性，了解其他压缩算法的特点和应用场景。以下是Python实现哈夫曼编码和译码的示例代码： ```python # 哈夫曼编码 import heapq import os class HuffmanCoding: def __init__(self, path): self.path = path self.heap = [] self.codes = {} self.reverse_mapping = {} class HeapNode: def __init__(self, char, freq): self.char = char self.freq = freq self.left = None self.right = None def __lt__(self, other): return self.freq < other.freq def __eq__(self, other): if(other == None): return False if(not isinstance(other, HeapNode)): return False return self.freq == other.freq def make_frequency_dict(self, text): frequency = {} for character in text: if not character in frequency: frequency[character] = 0 frequency[character] += 1 return frequency def make_heap(self, frequency): for key in frequency: node = self.HeapNode(key, frequency[key]) heapq.heappush(self.heap, node) def merge_nodes(self): while(len(self.heap)>1): node1 = heapq.heappop(self.heap) node2 = heapq.heappop(self.heap) merged = self.HeapNode(None, node1.freq + node2.freq) merged.left = node1 merged.right = node2 heapq.heappush(self.heap, merged) def make_codes_helper(self, root, current_code): if(root == None): return if(root.char != None): self.codes[root.char] = current_code self.reverse_mapping[current_code] = root.char return self.make_codes_helper(root.left, current_code + "0") self.make_codes_helper(root.right, current_code + "1") def make_codes(self): root = heapq.heappop(self.heap) current_code = "" self.make_codes_helper(root, current_code) def get_encoded_text(self, text): encoded_text = "" for character in text: encoded_text += self.codes[character] return encoded_text def pad_encoded_text(self, encoded_text): extra_padding = 8 - len(encoded_text) % 8 for i in range(extra_padding): encoded_text += "0" padded_info = "{0:08b}".format(extra_padding) encoded_text = padded_info + encoded_text return encoded_text def get_byte_array(self, padded_encoded_text): if(len(padded_encoded_text) % 8 != 0): print("Encoded text not padded properly") exit(0) b = bytearray() for i in range(0, len(padded_encoded_text), 8): byte = padded_encoded_text[i:i+8] b.append(int(byte, 2)) return b def compress(self): filename, file_extension = os.path.splitext(self.path) output_path = filename + ".bin" with open(self.path, 'r+') as file, open(output_path, 'wb') as output: text = file.read() text = text.rstrip() frequency = self.make_frequency_dict(text) self.make_heap(frequency) self.merge_nodes() self.make_codes() encoded_text = self.get_encoded_text(text) padded_encoded_text = self.pad_encoded_text(encoded_text) b = self.get_byte_array(padded_encoded_text) output.write(bytes(b)) print("Compressed") return output_path """ 哈夫曼译码 """ def remove_padding(self, padded_encoded_text): padded_info = padded_encoded_text[:8] extra_padding = int(padded_info, 2) padded_encoded_text = padded_encoded_text[8:] encoded_text = padded_encoded_text[:-1*extra_padding] return encoded_text def decode_text(self, encoded_text): current_code = "" decoded_text = "" for bit in encoded_text: current_code += bit if(current_code in self.reverse_mapping): character = self.reverse_mapping[current_code] decoded_text += character current_code = "" return decoded_text def decompress(self, input_path): filename, file_extension = os.path.splitext(self.path) output_path = filename + "_decompressed" + ".txt" with open(input_path, 'rb') as file, open(output_path, 'w') as output: bit_string = "" byte = file.read(1) while(len(byte) > 0): byte = ord(byte) bits = bin(byte)[2:].rjust(8, '0') bit_string += bits byte = file.read(1) encoded_text = self.remove_padding(bit_string) decompressed_text = self.decode_text(encoded_text) output.write(decompressed_text) print("Decompressed") return output_path # 测试 path = "test.txt" h = HuffmanCoding(path) output_path = h.compress() h.decompress(output_path) ```

阅读全文

哈夫曼编码和译码的实验收获

相关推荐

哈夫曼编码译码实验报告

哈夫曼编码-译码器实验报告

哈夫曼编码和译码实验

哈夫曼编码和译码实验难点

hufftree.rar_fft_哈夫曼_哈夫曼编码_哈夫曼编码 译码_哈夫曼编码和译码

哈夫曼编码和译码

哈夫曼编码和译码系统

哈夫曼编码和译码c++

哈夫曼树编码译码实验报告.doc

哈夫曼树编码译码实验报告.docx

哈夫曼树编码译码实验报告.pdf

哈夫曼编码和译码系统.doc

哈夫曼编码和译码系统.docx

哈夫曼编码和译码设计

哈夫曼编码和译码的意义

哈夫曼编码和译码的算法思想

哈夫曼编码译码源码+实验报告

数据库基础测验20241113.doc

微信小程序下拉选择组件

最新推荐

哈夫曼编码-译码器课程设计报告.docx

数据结构实验二哈夫曼树及哈夫曼编码译码的实现

数据结构实验报告哈夫曼编码译码

哈夫曼编码（贪心算法）报告.doc

数据库基础测验20241113.doc

黑板风格计算机毕业答辩PPT模板下载

管理建模和仿真的文件

提升点阵式液晶显示屏效率技术

在SoC芯片的射频测试中，ATE设备通常如何执行系统级测试以保证芯片量产的质量和性能一致？

CodeSandbox实现ListView快速创建指南

hufftree.rar_fft_哈夫曼_哈夫曼编码_哈夫曼编码译码_哈夫曼编码和译码