c语言哈夫曼编码压缩文件
时间: 2023-12-30 11:23:28 浏览: 46
C语言实现哈夫曼编码压缩文件的过程可以分为以下几个步骤:
1. 统计字符频率:从输入的文本文件中读取字符,并统计每个字符出现的频率。
2. 构建哈夫曼树:根据字符频率构建哈夫曼树。哈夫曼树是一种最优二叉树,其中频率较低的字符位于树的较低层,频率较高的字符位于树的较高层。
3. 生成哈夫曼编码表:通过遍历哈夫曼树,为每个字符生成对应的哈夫曼编码。哈夫曼编码是由0和1组成的二进制编码,用于表示每个字符。
4. 压缩文件:将输入的文本文件中的字符根据哈夫曼编码表进行编码,并将编码后的二进制数据写入输出文件。这样可以实现对文本文件的压缩。
5. 计算压缩率:通过比较压缩后的文件大小与原始文件大小,计算出压缩率。压缩率越高,表示压缩效果越好。
6. 解压文件:读取压缩文件中的二进制数据,并根据哈夫曼编码表进行解码,将解码后的字符写入输出文件。这样可以实现对压缩文件的解压缩。
以下是一个C语言实现哈夫曼编码压缩文件的示例代码:
```c
// 哈夫曼树节点结构体
typedef struct Node {
char data; // 字符
int freq; // 频率
struct Node* left;
struct Node* right;
} Node;
// 构建哈夫曼树
Node* buildHuffmanTree(char* text);
// 生成哈夫曼编码表
void generateHuffmanCodes(Node* root, char* code, int depth, char** codes);
// 压缩文件
void compressFile(char* inputFile, char* outputFile, char** codes);
// 解压文件
void decompressFile(char* inputFile, char* outputFile, Node* root);
// 计算文件大小
long getFileSize(FILE* file);
// 计算压缩率
float calculateCompressionRatio(long originalSize, long compressedSize);
int main() {
char* inputFile = "input.txt";
char* compressedFile = "compressed.bin";
char* decompressedFile = "decompressed.txt";
// 构建哈夫曼树
Node* root = buildHuffmanTree(inputFile);
// 生成哈夫曼编码表
char* codes[256];
generateHuffmanCodes(root, "", 0, codes);
// 压缩文件
compressFile(inputFile, compressedFile, codes);
// 解压文件
decompressFile(compressedFile, decompressedFile, root);
// 计算文件大小和压缩率
FILE* inputFilePtr = fopen(inputFile, "rb");
FILE* compressedFilePtr = fopen(compressedFile, "rb");
long originalSize = getFileSize(inputFilePtr);
long compressedSize = getFileSize(compressedFilePtr);
float compressionRatio = calculateCompressionRatio(originalSize, compressedSize);
printf("Compression ratio: %.2f%%\n", compressionRatio);
// 释放内存
// ...
return 0;
}
```