用C语言编写,基于哈夫曼树的数据压缩算法,要求:输入一串字符串,根据给定的字符串中字符出现的频率建立相应哈夫曼树,构造哈夫曼编码表,在此基础上可以对待压缩文件进行压缩(即编码),同时可以对压缩后的二进制编码文件进行解压(即译码)。代码

时间: 2024-02-13 12:07:50 浏览: 108

好的,以下是基于哈夫曼树的数据压缩算法的C语言代码:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define MAX_TREE_HT 100

// 定义哈夫曼树节点结构体
struct MinHeapNode {
    char data;  // 字符
    unsigned freq;  // 频率
    struct MinHeapNode *left, *right;  // 左右子节点
};

// 定义哈夫曼编码表结构体
struct HuffmanCode {
    char data;  // 字符
    char *code;  // 编码
};

// 定义哈夫曼编码表数组
struct HuffmanCode huffmanCodes[MAX_TREE_HT];

// 定义哈夫曼树节点最小堆结构体
struct MinHeap {
    unsigned size;  // 堆大小
    unsigned capacity;  // 堆容量
    struct MinHeapNode **array;  // 堆数组
};

// 创建一个哈夫曼树节点
struct MinHeapNode* newNode(char data, unsigned freq) {
    struct MinHeapNode* node = (struct MinHeapNode*)malloc(sizeof(struct MinHeapNode));
    node->left = node->right = NULL;
    node->data = data;
    node->freq = freq;
    return node;
}

// 创建一个哈夫曼树节点最小堆
struct MinHeap* createMinHeap(unsigned capacity) {
    struct MinHeap* minHeap = (struct MinHeap*)malloc(sizeof(struct MinHeap));
    minHeap->size = 0;
    minHeap->capacity = capacity;
    minHeap->array = (struct MinHeapNode**)malloc(minHeap->capacity * sizeof(struct MinHeapNode*));
    return minHeap;
}

// 交换两个哈夫曼树节点
void swapMinHeapNode(struct MinHeapNode** a, struct MinHeapNode** b) {
    struct MinHeapNode* t = *a;
    *a = *b;
    *b = t;
}

// 维护最小堆的性质
void minHeapify(struct MinHeap* minHeap, int idx) {
    int smallest = idx;
    int left = 2 * idx + 1;
    int right = 2 * idx + 2;

    if (left < minHeap->size &amp;&amp; minHeap->array[left]->freq < minHeap->array[smallest]->freq)
        smallest = left;

    if (right < minHeap->size &amp;&amp; minHeap->array[right]->freq < minHeap->array[smallest]->freq)
        smallest = right;

    if (smallest != idx) {
        swapMinHeapNode(&amp;minHeap->array[smallest], &amp;minHeap->array[idx]);
        minHeapify(minHeap, smallest);
    }
}

// 判断最小堆中是否只剩下一个节点
int isSizeOne(struct MinHeap* minHeap) {
    return (minHeap->size == 1);
}

// 从最小堆中取出频率最小的节点
struct MinHeapNode* extractMin(struct MinHeap* minHeap) {
    struct MinHeapNode* temp = minHeap->array[0];
    minHeap->array[0] = minHeap->array[minHeap->size - 1];
    --minHeap->size;
    minHeapify(minHeap, 0);
    return temp;
}

// 插入一个节点到最小堆
void insertMinHeap(struct MinHeap* minHeap, struct MinHeapNode* minHeapNode) {
    ++minHeap->size;
    int i = minHeap->size - 1;
    while (i &amp;&amp; minHeapNode->freq < minHeap->array[(i - 1) / 2]->freq) {
        minHeap->array[i] = minHeap->array[(i - 1) / 2];
        i = (i - 1) / 2;
    }
    minHeap->array[i] = minHeapNode;
}

// 构建哈夫曼树
struct MinHeapNode* buildHuffmanTree(char data[], int freq[], int size) {
    struct MinHeapNode *left, *right, *top;
    struct MinHeap* minHeap = createMinHeap(size);
    for (int i = 0; i < size; ++i)
        insertMinHeap(minHeap, newNode(data[i], freq[i]));
    while (!isSizeOne(minHeap)) {
        left = extractMin(minHeap);
        right = extractMin(minHeap);
        top = newNode('$', left->freq + right->freq);
        top->left = left;
        top->right = right;
        insertMinHeap(minHeap, top);
    }
    return extractMin(minHeap);
}

// 将哈夫曼编码存储到数组中
void storeCodes(struct MinHeapNode* root, char* str, int top) {
    if (root->left) {
        str[top] = '0';
        storeCodes(root->left, str, top + 1);
    }
    if (root->right) {
        str[top] = '1';
        storeCodes(root->right, str, top + 1);
    }
    if (!root->left &amp;&amp; !root->right) {
        huffmanCodes[root->data].data = root->data;
        huffmanCodes[root->data].code = (char*)malloc(sizeof(char) * (top + 1));
        memcpy(huffmanCodes[root->data].code, str, top + 1);
    }
}

// 构造哈夫曼编码表
void buildHuffmanCodes(struct MinHeapNode* root) {
    char str[MAX_TREE_HT];
    storeCodes(root, str, 0);
}

// 将字符串进行哈夫曼编码
void encodeString(char* str, FILE* fp) {
    int i = 0;
    while (str[i]) {
        fwrite(huffmanCodes[str[i]].code, strlen(huffmanCodes[str[i]].code), 1, fp);
        ++i;
    }
}

// 将二进制编码还原成原始字符串
void decodeString(struct MinHeapNode* root, char* code, FILE* fp) {
    struct MinHeapNode* curr = root;
    int i = 0;
    while (code[i]) {
        if (code[i] == '0')
            curr = curr->left;
        else
            curr = curr->right;
        if (!curr->left &amp;&amp; !curr->right) {
            fwrite(&amp;curr->data, sizeof(curr->data), 1, fp);
            curr = root;
        }
        ++i;
    }
}

// 主函数
int main() {
    char data[] = "Huffman coding is a data compression algorithm.";
    int freq[] = { 3, 5, 1, 1, 2, 3, 2, 1, 4, 1, 2, 2, 1, 5, 1, 3, 2, 2, 3, 2, 1, 1, 1, 1, 1, 1 };
    int size = sizeof(data) / sizeof(data[0]);

    // 构建哈夫曼树
    struct MinHeapNode* root = buildHuffmanTree(data, freq, size);

    // 构造哈夫曼编码表
    buildHuffmanCodes(root);

    // 对字符串进行哈夫曼编码并写入文件
    FILE* fp = fopen("compressed.bin", "wb");
    encodeString(data, fp);
    fclose(fp);

    // 从文件中读取哈夫曼编码并还原成原始字符串
    fp = fopen("compressed.bin", "rb");
    fseek(fp, 0L, SEEK_END);
    int sizeOfFile = ftell(fp);
    char* code = (char*)malloc(sizeOfFile + 1);
    fseek(fp, 0L, SEEK_SET);
    fread(code, sizeOfFile, 1, fp);
    code[sizeOfFile] = '\0';
    fclose(fp);

    fp = fopen("decompressed.txt", "w");
    decodeString(root, code, fp);
    fclose(fp);

    return 0;
}

该代码可以对给定字符串进行哈夫曼编码,并将编码后的二进制数据写入文件。同时,该代码还可以从文件中读取哈夫曼编码并还原成原始字符串。

向AI提问 loading 发送消息图标

相关推荐

zip

大家在看

recommend-type

基于MATLAB的表面裂纹识别与检测

基于MATLAB的表面裂纹识别与检测,该代码可以根据自己需要去识别与检测特定对象的表面裂纹,例如,路面裂纹检测、钢管裂纹检测、平面裂纹检测、种子等农产品表面裂纹检测。
recommend-type

Launcher3原理及二次开发

此资源是在安卓巴士交会上王鹏工程师分享的Launcher3的原理及二次开发pdf。文中介绍啦Launcher3的框架和主要流程,能给从事Lauuncher3开发和桌面定制的开发人员启迪。特此分享出来。
recommend-type

Keysight N6705C直流电源分析仪.pdf

Keysight N6705C直流电源分析仪
recommend-type

某大型国企信息化项目验收管理办法.pdf

某大型国企信息化项目验收管理办法.pdf
recommend-type

CST PCB电磁兼容解决方案

印制电路板(PCB:Printed Circuit Board)目前已广泛应用于电子产品中。随着电子技术的飞速发展,芯片的频率越来越高,PCB,特别是高速PCB面临着各种电磁兼容问题。传统的基于路的分析方法已经不能准确地描述PCB上各走线的传输特性,因此需要采用基于电磁场的分析方法充分考虑PCB上各分布式参数来分析PCB的电磁兼容问题。   CST是目前的纯电磁场仿真软件公司。其产品广泛应用于通信、国防、自动化、电子和医疗设备等领域。2007年CST收购并控股了德国Simlab公司,将其下整个团队和软件全面纳入CST的管理和软件开发计划之中,同时在原有PCBMod软件基础上开发全新算法和功能

最新推荐

recommend-type

C语言中压缩字符串的简单算法小结

在C语言中,字符串压缩是一种将字符串转换为更紧凑形式的技术,常用于节省存储空间或提高数据处理效率。本文将重点介绍三种简单的字符串压缩算法,包括哈夫曼编码,以及它们在不同场景中的应用。 首先,最基础的...
recommend-type

人工智能发展对芯片行业的颠覆性变革及其对中国AI芯片产业的影响

内容概要:本文探讨了人工智能(AI)对芯片行业的深远影响,特别是AI芯片的定义、类型与发展现状。文中详细介绍了AI芯片(如GPU、FPGA、ASIC)的特点及其在不同应用场景中的表现。随着AI技术的进步,芯片设计流程发生了重大变革,包括自动化设计和创新设计,制程工艺也在AI需求的推动下迅速迭代。此外,AI芯片市场的格局正在重塑,新玩家不断涌现,国际竞争加剧。中国AI芯片行业发展迅速,但也面临技术瓶颈、市场竞争和人才短缺等挑战。未来,AI芯片将在技术创新、市场拓展和可持续发展中继续前行。 适合人群:对半导体行业、人工智能技术感兴趣的读者,尤其是从事芯片设计、制造及相关领域的专业人士。 使用场景及目标:帮助读者了解AI芯片行业的最新发展趋势和技术动向,为企业决策和个人职业规划提供参考。 其他说明:文章还强调了AI与芯片行业的深度融合可能带来的新商业模式,以及国产AI芯片企业需加强国际合作与交流,推动绿色可持续发展。
recommend-type

基于JAVA的网络通讯系统设计与实现(论文+系统).zip

Java项目课程设计,包含源码+数据库+论文
recommend-type

(源码)基于Arduino的实时温度短信警报系统.zip

# 基于Arduino的实时温度短信警报系统 ## 项目简介 这是一个使用Arduino,LM35温度传感器和GSM模块实现的实时温度短信警报系统。当温度超过设定的限制时,系统将自动向用户发送短信警报。这个项目涉及到硬件和电子组件的简单组装和编程技术。这是一个易于使用,便捷有效的警告系统,适用于家庭、办公室或其他需要实时监控温度的场合。 ## 项目的主要特性和功能 使用Arduino Uno作为主要的控制器,控制LM35温度传感器和GSM模块。 通过LM35温度传感器读取温度数据。 使用GSM模块发送短信警报。 具有灵活性,可设定温度阈值。当温度超过设定的阈值时,系统将自动发送短信提醒用户。 简单易用的电路设计,只需要基本的电子组装技能就能搭建完成。 ## 安装使用步骤 假设用户已经下载了本项目的源码文件 1. 连接硬件按照电路图连接Arduino Uno、LM35温度传感器、GSM模块及其他所需硬件。
recommend-type

C#游戏开发教程与实践:应用程序制作

标题与描述重复提及“C#应用程序游戏制作”,这显然是关于使用C#语言开发游戏的内容。C#是一种由微软开发的面向对象的高级编程语言,广泛应用于Windows平台的桌面和服务器端应用程序开发。在游戏开发领域,C#经常与Unity游戏引擎一起使用,因为Unity提供了对C#的全面支持,并且允许开发者利用这一语言来编写游戏逻辑、控制游戏流程和实现各种交互效果。 根据标题和描述,我们可以提炼出以下几点关键知识点: 1. C#编程基础 C#是一种强类型、面向对象的编程语言。游戏开发人员需要熟悉C#的基本语法,包括数据类型、控制结构、类和对象、继承、接口、委托、事件等。这些是使用C#进行游戏开发的基础。 2. Unity游戏引擎 Unity是一个跨平台的游戏开发引擎,支持2D和3D游戏的开发。Unity编辑器提供场景编辑、物理引擎、光照、动画等多种工具。Unity支持C#作为主要的脚本语言,使得游戏开发者可以利用C#来编写游戏逻辑和交互。 3. 游戏开发流程 游戏制作是一个涉及多个阶段的过程,包括概念设计、原型开发、内容创建、编程、测试和发布。了解C#在游戏开发每个阶段中的应用是十分重要的。 4. 游戏引擎架构和API 游戏引擎提供的API使得开发者可以访问和控制引擎的各种功能,如渲染、音效、输入管理等。C#开发者需要熟悉Unity的API,以便高效地利用引擎资源。 5. 脚本编写 在Unity中,游戏逻辑通常是通过编写C#脚本实现的。开发者需要掌握如何在Unity项目中创建、组织和调试C#脚本。 6. 性能优化 游戏性能优化是游戏开发中的一个重要方面。了解C#中的内存管理、垃圾回收、性能分析工具等,对于确保游戏流畅运行至关重要。 7. 图形和动画 C#与Unity结合可以用来创建游戏中的2D和3D图形以及动画。开发者需要掌握如何使用C#代码来控制Unity的动画系统和渲染管线。 8. 物理引擎和碰撞检测 Unity内置了物理引擎,C#脚本可以用来控制物理行为,如刚体动力学、力和碰撞检测等。了解如何利用C#在Unity中实现物理交互是游戏开发的一个核心技能。 由于文件名列表中仅提供“练习读取文件”的信息,这并不直接与游戏开发相关,因此我们无法从这个信息中推断出关于游戏制作的额外知识点。不过,阅读和解析文件是编程的基础技能之一,对于游戏开发者来说,能够正确处理和读取项目所需的各类资源文件(如图片、音频、配置文件等)是非常重要的。 综上所述,上述知识点是游戏开发者在使用C#和Unity进行游戏开发过程中必须掌握的核心技能。通过深入学习这些内容,开发者能够更好地利用C#语言来制作出高质量和高性能的游戏作品。
recommend-type

5G网络架构精讲:核心至边缘的全面解析

# 摘要 本文全面分析了5G网络架构的特点、核心网的演进与功能、无线接入网的技术和架构、边缘计算与网络架构的融合,以及5G网络安全架构与策略和网络的管理运维。从5G网络架构的概述入手,深入到核心网虚拟化、网
recommend-type

vscode中配置node

### 配置 Visual Studio Code 的 Node.js 开发环境 #### 安装必要的扩展 为了更好地支持Node.js开发,在Visual Studio Code中推荐安装一些有用的扩展。可以通过访问Visual Studio Code的市场来查找并安装这些扩展,例如JavaScript(ES6) code snippets、Path Intellisense等[^1]。 #### 设置工作区和文件夹结构 当准备在一个新的项目上开始时,应该先创建一个新的文件夹作为项目的根目录,并在这个位置初始化Git仓库(如果打算使用版本控制)。接着可以在命令行工具里执行`npm ini
recommend-type

Thinkphp在线数据库备份与还原操作指南

数据库备份是信息系统中非常重要的一环,它能够在数据丢失、系统故障或受到攻击后,快速恢复数据,减少损失。ThinkPHP是一个流行的PHP开发框架,它提供了一套简便的开发模式,经常被用于快速构建Web应用。在使用ThinkPHP开发过程中,数据库备份和还原是一项基础且必要的工作,尤其是在生产环境中,对于保证数据的安全性和完整性至关重要。 ### 数据库备份的必要性 在进行数据库备份之前,首先要明确备份的目的和重要性。数据库备份的主要目的是防止数据丢失,包括硬件故障、软件故障、操作失误、恶意攻击等原因造成的损失。通过定期备份,可以在灾难发生时迅速恢复到备份时的状态,降低业务中断的风险。 ### ThinkPHP框架与数据库备份 ThinkPHP框架内核自带了数据库操作类DB类,它提供了简单而强大的数据库操作能力。但DB类本身并不直接提供备份和还原数据库的功能。因此,要实现在线备份下载和还原功能,需要借助额外的工具或编写相应的脚本来实现。 ### 数据库在线备份下载 在线备份数据库通常意味着通过Web服务器上的脚本,将数据库数据导出到文件中。在ThinkPHP中,可以结合PHP的PDO(PHP Data Objects)扩展来实现这一功能。PDO扩展提供了一个数据访问抽象层,这意味着无论使用什么数据库,都可以使用相同的函数来执行查询和获取数据。 1. **PDO的使用**:通过ThinkPHP框架中的DB类建立数据库连接后,可以使用PDO方法来执行备份操作。通常,备份操作包括将表结构和数据导出到.sql文件中。 2. **生成.sql文件**:生成.sql文件通常涉及执行SQL的“SAVEPOINT”,“COMMIT”,“USE database_name”,“SELECT ... INTO OUTFILE”等语句。然后通过PHP的`header`函数来控制浏览器下载文件。 3. **ThinkPHP的响应类**:为了方便文件下载,ThinkPHP框架提供了响应类,可以用来设置HTTP头部信息,并输出文件内容给用户下载。 ### 数据库还原 数据库还原是备份的逆过程,即将.sql文件中的数据导入数据库中。在ThinkPHP中,可以编写一个还原脚本,利用框架提供的方法来执行还原操作。 1. **读取.sql文件**:首先需要将上传的.sql文件读取到内存中,可以使用PHP的`file_get_contents()`函数读取文件内容。 2. **执行SQL语句**:读取到.sql文件内容后,通过ThinkPHP的DB类或直接使用PDO对象来执行其中的SQL语句。 3. **处理数据导入**:如果是大型数据库备份,直接通过脚本执行SQL语句可能会耗时较长,可以考虑使用数据库管理工具(如phpMyAdmin)来导入.sql文件,或者使用命令行工具(如mysql命令)进行导入。 ### 安全性考虑 在进行数据库备份和还原时,需要注意安全性的问题: 1. **备份文件的加密存储**:备份得到的.sql文件应存储在安全的位置,并考虑使用密码或其他加密手段进行保护。 2. **还原操作的权限控制**:需要确保只有具备相应权限的用户可以访问和执行还原操作。 3. **数据传输加密**:如果通过Web下载备份文件或上传还原文件,应确保使用HTTPS协议加密数据传输,防止数据被截获。 ### ThinkPHP框架内核的使用 虽然ThinkPHP框架内核不直接提供数据库备份和还原功能,但它的灵活配置和高度扩展性允许开发者快速实现这些功能。例如,可以在ThinkPHP的模块系统中创建一个新的模块,专门用于处理数据库的备份和还原任务。通过模块化的方式,可以将相关代码封装起来,方便维护和扩展。 ### 结论 在ThinkPHP框架中实现数据库的在线备份下载和还原功能,需要开发者具备一定的PHP编程技能和对数据库操作的理解。通过合理运用ThinkPHP框架提供的类和方法,并注意数据安全性问题,开发者可以构建出稳定可靠的备份和还原解决方案,从而保护开发的Web应用的数据安全。
recommend-type

【5G网络新纪元】:掌握5G Toolbox的15个必知技巧

# 摘要 随着第五代移动通信技术(5G)的发展,5G Toolbox作为网络测试与管理的重要工具,提供了网络性能测试、设备管理、网络切片管理和安全管理等方面的技巧和方法。本文首先介绍了5G网络的基础知识和5G Toolbox的基本功能。随后,深入探讨了使用5G Toolbox进行网络性能测试,包括延迟、吞吐量、信号覆盖和质量分析等;网络设备的注册
recommend-type

visual studio逐语句是灰的

### 解决 Visual Studio 中逐语句调试选项变灰的问题 当遇到 Visual Studio 中逐语句调试选项变为灰色不可用的情况时,通常是因为当前项目配置或编译设置不满足逐语句调试的要求。以下是可能的原因及对应的解决方案: #### 1. 编译器优化设置 如果启用了编译器优化,则某些调试功能可能会被禁用。为了启用逐语句调试,应确保关闭了优化选项。 - 打开项目的属性页,在菜单栏上选择“项目>属性”。 - 导航到“配置属性>C/C++>优化”,并将“优化级别”设为“已禁用(/Od)”[^1]。 #### 2. 调试信息生成 确认是否正确设置了生成调试信息的选项。对于 C++
手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部