C++实现哈夫曼编码译码
时间: 2023-10-02 15:08:52 浏览: 145
哈夫曼编码是一种常用的数据压缩算法,它可以根据数据出现的频率构建不等长的编码,从而达到压缩数据的目的。以下是使用C++实现哈夫曼编码和译码的示例代码。
首先,需要实现哈夫曼树的构建和编码表的生成。定义一个Node结构体表示哈夫曼树的节点,其中weight表示节点的权值,left和right分别表示节点的左右子节点,code表示节点对应的编码。
```cpp
struct Node {
int weight;
Node* left;
Node* right;
string code;
Node(int w, Node* l, Node* r): weight(w), left(l), right(r) {}
};
```
接下来,定义一个比较函数用于在优先队列中对节点按照权值从小到大排序。
```cpp
struct cmp {
bool operator()(Node* a, Node* b) {
return a->weight > b->weight;
}
};
```
然后,实现哈夫曼树的构建函数buildHuffmanTree,该函数接受一个表示字符出现频率的数组freq和字符集合大小n作为参数,返回哈夫曼树的根节点。
```cpp
Node* buildHuffmanTree(int freq[], int n) {
priority_queue<Node*, vector<Node*>, cmp> pq;
for (int i = 0; i < n; i++) {
if (freq[i] > 0) {
pq.push(new Node(freq[i], nullptr, nullptr));
}
}
while (pq.size() > 1) {
Node* left = pq.top();
pq.pop();
Node* right = pq.top();
pq.pop();
Node* parent = new Node(left->weight + right->weight, left, right);
pq.push(parent);
}
return pq.top();
}
```
接下来,实现生成编码表的函数generateCodes,该函数接受一个哈夫曼树的根节点和一个表示字符集合的数组chSet作为参数,返回一个表示字符编码的数组。
```cpp
void generateCodes(Node* root, string code, string codes[]) {
if (root->left == nullptr && root->right == nullptr) {
codes[root->weight] = code;
root->code = code;
return;
}
generateCodes(root->left, code + '0', codes);
generateCodes(root->right, code + '1', codes);
}
```
接下来,实现哈夫曼编码的函数encode,该函数接受一个表示原始文本的字符串text和一个表示字符编码的数组codes作为参数,返回一个表示编码后的二进制串。
```cpp
string encode(string text, string codes[]) {
string result;
for (char ch: text) {
result += codes[ch];
}
return result;
}
```
最后,实现哈夫曼译码的函数decode,该函数接受一个表示编码后的二进制串code和一个表示哈夫曼树的根节点root作为参数,返回一个表示译码后的原始文本字符串。
```cpp
string decode(string code, Node* root) {
Node* p = root;
string result;
for (char ch: code) {
if (ch == '0') {
p = p->left;
} else {
p = p->right;
}
if (p->left == nullptr && p->right == nullptr) {
result += char(p->weight);
p = root;
}
}
return result;
}
```
完整代码如下:
```cpp
#include <iostream>
#include <queue>
using namespace std;
struct Node {
int weight;
Node* left;
Node* right;
string code;
Node(int w, Node* l, Node* r): weight(w), left(l), right(r) {}
};
struct cmp {
bool operator()(Node* a, Node* b) {
return a->weight > b->weight;
}
};
Node* buildHuffmanTree(int freq[], int n) {
priority_queue<Node*, vector<Node*>, cmp> pq;
for (int i = 0; i < n; i++) {
if (freq[i] > 0) {
pq.push(new Node(freq[i], nullptr, nullptr));
}
}
while (pq.size() > 1) {
Node* left = pq.top();
pq.pop();
Node* right = pq.top();
pq.pop();
Node* parent = new Node(left->weight + right->weight, left, right);
pq.push(parent);
}
return pq.top();
}
void generateCodes(Node* root, string code, string codes[]) {
if (root->left == nullptr && root->right == nullptr) {
codes[root->weight] = code;
root->code = code;
return;
}
generateCodes(root->left, code + '0', codes);
generateCodes(root->right, code + '1', codes);
}
string encode(string text, string codes[]) {
string result;
for (char ch: text) {
result += codes[ch];
}
return result;
}
string decode(string code, Node* root) {
Node* p = root;
string result;
for (char ch: code) {
if (ch == '0') {
p = p->left;
} else {
p = p->right;
}
if (p->left == nullptr && p->right == nullptr) {
result += char(p->weight);
p = root;
}
}
return result;
}
int main() {
int freq[256] = {0};
string text = "hello world";
for (char ch: text) {
freq[ch]++;
}
Node* root = buildHuffmanTree(freq, 256);
string codes[256];
generateCodes(root, "", codes);
string code = encode(text, codes);
cout << "Encoded: " << code << endl;
string decoded = decode(code, root);
cout << "Decoded: " << decoded << endl;
return 0;
}
```
阅读全文