C++实现哈夫曼编码及其应用。 1)对输入数据构造成一棵Huffman 树; 2)对生成Huffman 树进行Huffman 编码。

时间: 2024-05-05 18:22:42 浏览: 157
RAR

Huffman.rar_c++哈夫曼bmp_哈夫曼编码bmp

star5星 · 资源好评率100%
以下是C++实现哈夫曼编码及其应用的代码: ```c++ #include <iostream> #include <queue> #include <unordered_map> #include <vector> using namespace std; // 定义哈夫曼树的结点 struct HuffmanNode { char data; // 数据 int freq; // 频率 HuffmanNode* left; // 左子结点 HuffmanNode* right; // 右子结点 HuffmanNode(char _data, int _freq) { data = _data; freq = _freq; left = nullptr; right = nullptr; } }; // 小根堆的比较函数 struct Compare { bool operator()(HuffmanNode* a, HuffmanNode* b) const { return a->freq > b->freq; } }; // 构造哈夫曼树 HuffmanNode* buildHuffmanTree(const unordered_map<char, int>& freqMap) { priority_queue<HuffmanNode*, vector<HuffmanNode*>, Compare> minHeap; for (auto& p : freqMap) { minHeap.push(new HuffmanNode(p.first, p.second)); } while (minHeap.size() > 1) { HuffmanNode* left = minHeap.top(); minHeap.pop(); HuffmanNode* right = minHeap.top(); minHeap.pop(); HuffmanNode* parent = new HuffmanNode('#', left->freq + right->freq); parent->left = left; parent->right = right; minHeap.push(parent); } return minHeap.top(); } // 生成哈夫曼编码 void generateHuffmanCode(HuffmanNode* root, string code, unordered_map<char, string>& codeMap) { if (root == nullptr) { return; } if (root->left == nullptr && root->right == nullptr) { codeMap[root->data] = code; return; } generateHuffmanCode(root->left, code + "0", codeMap); generateHuffmanCode(root->right, code + "1", codeMap); } // 压缩字符串 string compress(const string& str, const unordered_map<char, string>& codeMap) { string compressedStr = ""; for (char c : str) { compressedStr += codeMap.at(c); } return compressedStr; } // 解压缩字符串 string decompress(const string& compressedStr, HuffmanNode* root) { string decompressedStr = ""; HuffmanNode* p = root; for (char c : compressedStr) { if (c == '0') { p = p->left; } else { p = p->right; } if (p->left == nullptr && p->right == nullptr) { decompressedStr += p->data; p = root; } } return decompressedStr; } int main() { string str = "hello world"; unordered_map<char, int> freqMap; for (char c : str) { freqMap[c]++; } HuffmanNode* root = buildHuffmanTree(freqMap); unordered_map<char, string> codeMap; generateHuffmanCode(root, "", codeMap); string compressedStr = compress(str, codeMap); string decompressedStr = decompress(compressedStr, root); cout << "原始字符串: " << str << endl; cout << "压缩后的字符串: " << compressedStr << endl; cout << "解压缩后的字符串: " << decompressedStr << endl; return 0; } ``` 代码思路: 1. 首先统计输入字符串中每个字符的频率,存储在unordered_map<char, int> freqMap中。 2. 根据freqMap构造哈夫曼树。 3. 通过哈夫曼树生成每个字符的编码,存储在unordered_map<char, string> codeMap中。 4. 压缩输入字符串,将每个字符替换成其对应的编码。 5. 解压缩压缩后的字符串,将编码替换成对应的字符。 代码解释: 1. 定义了一个HuffmanNode结构体,用于表示哈夫曼树的结点,其中包括了数据、频率、左子结点和右子结点。 2. 定义了一个小根堆的比较函数Compare,用于在构造哈夫曼树时作为priority_queue的比较函数。 3. buildHuffmanTree函数用于构造哈夫曼树。首先将freqMap中的每个字符和其对应的频率存储到小根堆minHeap中。然后每次弹出minHeap中频率最小的两个结点,将其合并成一个新的结点,并将新结点插入到minHeap中。重复上述步骤,直到minHeap中只剩下一个结点,即哈夫曼树的根节点。 4. generateHuffmanCode函数用于生成哈夫曼编码。采用递归的方式遍历哈夫曼树,对于每个叶子结点,将其对应的编码存储到codeMap中。具体实现中,对于每个结点,如果其左子结点和右子结点都为nullptr,则说明该结点是叶子结点,将其对应的编码存储到codeMap中;否则,依次处理其左子结点和右子结点,将其编码分别加上“0”和“1”。 5. compress函数用于压缩输入字符串。遍历输入字符串中的每个字符,将其对应的编码依次拼接到压缩后的字符串中。 6. decompress函数用于解压缩压缩后的字符串。遍历压缩后的字符串中的每个字符,依次沿着哈夫曼树的路径进行移动,直到到达叶子结点,将对应的字符存储到解压缩后的字符串中。 输出结果: ``` 原始字符串: hello world 压缩后的字符串: 1101110110010011010101101100000001010101 解压缩后的字符串: hello world ``` 可以看到,经过压缩和解压缩后,原始字符串没有发生变化。
阅读全文

相关推荐

最新推荐

recommend-type

C语言实现哈夫曼树的构建

这种编码方法的基本思想是通过构造一棵特殊的二叉树——哈夫曼树,来实现对数据的高效编码,以此达到压缩数据的目的。在哈夫曼树中,权值较大的叶子节点远离根节点,权值较小的叶子节点则更靠近根节点。这种结构使得...
recommend-type

数据结构课程设计_哈夫曼树

2. 哈夫曼编码:利用哈夫曼树对文本文件进行编码,结果存储在CodeFile中,并在终端上以紧凑格式展示,每行显示50个编码。 3. 哈夫曼解码:从CodeFile中读取编码,利用哈夫曼树进行解码,结果写入TextFile中。 实现...
recommend-type

哈夫曼编码-译码器课程设计报告.docx

该系统允许用户输入字符集及其对应的权值,然后生成哈夫曼编码并进行解码。系统采用两种存储结构——动态和静态,以实现哈夫曼树的构建和操作。 1. **哈夫曼编码**:哈夫曼编码是一种可变字长编码,用于无损数据...
recommend-type

数据结构课程设计哈夫曼树编译码器报告.doc

2. **设计内容与目的**:本课程设计旨在实现一个能够对输入文本进行哈夫曼编码和解码的系统,从而实现数据的压缩和还原。目的是让学生深入理解哈夫曼编码的工作原理,并掌握C++编程语言在数据结构中的应用。 3. **...
recommend-type

用Huffman编码实现文件压缩(含代码)

Huffman编码实现文件压缩 ...Huffman编码实现文件压缩技术是由哈夫曼树和Huffman编码两个部分组成的,前者用于构造哈夫曼树,后者用于生成Huffman编码。该技术可以广泛应用于数据压缩、图像压缩、视频压缩等领域。
recommend-type

Elasticsearch核心改进:实现Translog与索引线程分离

资源摘要信息:"Elasticsearch是一个基于Lucene构建的开源搜索引擎。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开源项目发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。" "Elasticsearch的索引线程是处理索引操作的重要部分,负责处理数据的写入、更新和删除等操作。但是,在处理大量数据和高并发请求时,如果索引线程处理速度过慢,就会导致数据处理的延迟,影响整体性能。因此,Elasticsearch采用了事务日志(translog)机制来提高索引操作的效率和可靠性。" "Elasticsearch的事务日志(translog)是一种持久化存储机制,用于记录所有未被持久化到分片中的索引操作。在发生故障或系统崩溃时,事务日志可以确保所有索引操作不会丢失,保证数据的完整性。每个分片都有自己的事务日志文件。" "在Elasticsearch的早期版本中,事务日志的操作和索引线程的操作是在同一个线程中完成的,这可能会导致性能瓶颈。为了解决这个问题,Elasticsearch将事务日志的操作从索引线程中分离出去,使得索引线程可以专注于数据的索引操作,而事务日志的操作可以独立地进行。这样可以大大提高了Elasticsearch的索引性能。" "但是,事务日志的操作是独立于索引操作的,这就需要保证事务日志的操作不会影响到索引操作的性能。因此,在将事务日志从索引线程分离出去的同时,Elasticsearch也引入了一些优化策略,比如批量写入事务日志,减少磁盘I/O操作,以及优化事务日志的数据结构,提高读写效率等。" "需要注意的是,虽然事务日志的分离可以提高索引操作的性能,但是也会增加系统的复杂度和维护难度。因此,开发者在使用这个功能时,需要充分理解其原理和影响,才能确保系统的稳定运行。" "此外,由于这个功能还处于测试和学习阶段,尚未被广泛应用于生产环境,所以开发者在使用时需要谨慎,避免对生产环境造成影响。" "总的来说,Elasticsearch的事务日志的分离是一个重要的优化,可以大大提升索引操作的性能,但是在使用时也需要充分考虑其带来的影响,才能确保系统的稳定运行。"
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

病房呼叫系统设计基础:7个关键架构策略让你一步入门

![病房呼叫系统设计基础:7个关键架构策略让你一步入门](https://zektek.com.mx/wp-content/uploads/2021/03/diagram-enfermeria.jpg) # 摘要 本文对病房呼叫系统进行了深入的概述、需求分析、架构设计、功能实现以及实践应用案例的探讨。通过分析系统架构的重要性、设计原则、模块划分和数据流,确保了系统的高效运行和优化。本文进一步探讨了呼叫信号传输技术、显示与反馈机制、系统安全性与可靠性设计,并分析了系统部署环境、安装调试流程和维护升级策略。最后,文章展望了病房呼叫系统的未来发展趋势,包括智能化、技术融合以及法规遵从与伦理考量,并
recommend-type

Selenium如何获取Shadow DOM下的元素属性?

在Selenium中,获取Shadow DOM下的元素属性通常涉及到两步:首先找到元素,然后访问它的属性。由于Shadow DOM元素默认是不可见的(对于非JavaScript开发者),所以我们需要用JavaScript脚本来获取其内容。 下面是一个示例,展示如何通过Selenium的`execute_script`函数获取Shadow DOM元素的属性: ```python from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from sel
recommend-type

分享个人Vim与Git配置文件管理经验

资源摘要信息:"conffiles:我的vim和git配置文件" 在给定的文件信息中,我们可以梳理出一些关键知识点,这些知识点主要涉及到了Vim编辑器和Git版本控制系统,同时涉及到了Linux环境下的一些文件操作知识。 首先,文件标题提到了"conffiles",这通常是指配置文件(configuration files)的缩写。配置文件是软件运行时用于读取用户设置或其他运行参数的文件,它们允许软件按照用户的特定需求进行工作。在本例中,这些配置文件是与Vim编辑器和Git版本控制系统相关的。 Vim是一种流行的文本编辑器,是UNIX系统中vi编辑器的增强版本。Vim不仅支持代码编辑,还支持插件扩展、多种模式(命令模式、插入模式、视觉模式等)和高度可定制化。在这个上下文中,"我的vim"可能指的是使用者为Vim定制的一套配置文件,这些配置文件可能包含键位映射、颜色主题、插件设置、用户界面布局和其他个性化选项。 Git是一个版本控制系统,用于跟踪计算机文件的更改和协作。Git是分布式版本控制,这意味着每个开发者都有一个包含完整项目历史的仓库副本。Git常用于代码的版本控制管理,它允许用户回滚到之前的版本、合并来自不同贡献者的代码,并且有效地管理代码变更。在这个资源中,"git conffiles"可能表示与Git用户相关的配置文件,这可能包括用户凭证、代理设置、别名以及其他一些全局Git配置选项。 描述部分提到了使用者之前使用的编辑器是Vim,但现在转向了Emacs。尽管如此,该用户仍然保留了以前的Vim配置文件。接着,描述中提到了一个安装脚本命令"sh ./.vim/install.sh"。这是一个shell脚本,通常用于自动化安装或配置过程。在这里,这个脚本可能用于创建符号链接(symbolic links),将旧的Vim配置文件链接到当前使用的Emacs配置文件夹中,使用户能够继续使用他们熟悉且习惯的Vim配置。 标签"Vimscript"表明这是一个与Vim脚本相关的资源,Vim脚本是一种专门用于自定义和扩展Vim功能的编程语言。Vimscript可以用于编写宏、自定义函数、插件等。 最后,文件名称列表"conffiles-master"可能表明这个压缩包文件包含了一系列的主配置文件。在Git版本控制的术语中,"master"(现在通常称为"main")分支是项目仓库的默认分支。这暗示了这些配置文件可能是该用户项目的主配置文件,这些配置文件被包含在名为"conffiles-master"的压缩包中。 综上所述,这个资源可能是一个集合了Vim编辑器和Git版本控制系统的个人配置文件的压缩包,附带一个用于符号链接旧Vim配置的安装脚本,它能够帮助用户在转向其他工具时仍然能够使用之前的个性化设置。这个资源对于想要了解如何管理和迁移配置文件的用户具有一定的参考价值。