堆的应用之六：数据流中位数问题

![堆的应用之六：数据流中位数问题](https://img-blog.csdnimg.cn/a18be9a1064f4217b7d4babbf563c96f.png) # 1.1 堆的基本概念堆是一种完全二叉树，其中每个节点的值都大于或等于其子节点的值。这种数据结构具有两个重要的性质： - **堆序性：**每个节点的值都大于或等于其子节点的值。 - **完全二叉树：**除了最后一层之外，每一层都完全填充，最后一层尽可能地从左向右填充。 # 2. 堆的算法实现堆是一种完全二叉树，其中每个节点的值都大于或等于其子节点的值。堆有两种类型：最大堆和最小堆。最大堆中，根节点的值最大，而最小堆中，根节点的值最小。 ### 2.1 堆的初始化和插入堆的初始化可以通过一次性插入所有元素或逐个插入元素来实现。 #### 一次性插入 ```python def build_heap(arr): n = len(arr) for i in range(n // 2 - 1, -1, -1): heapify(arr, i, n) ``` ``` 参数说明： - arr：待构建的堆 - i：从堆的最后一个非叶子节点开始，逐层向上调整 - n：堆的大小 ``` ``` 逻辑分析：从最后一个非叶子节点开始，逐层向上调整，确保每个子树都是堆。 ``` #### 逐个插入 ```python def insert_heap(heap, value): heap.append(value) i = len(heap) - 1 while i > 0: parent = (i - 1) // 2 if heap[i] > heap[parent]: heap[i], heap[parent] = heap[parent], heap[i] i = parent ``` ``` 参数说明： - heap：待插入元素的堆 - value：待插入的元素 ``` ``` 逻辑分析：将元素插入堆的末尾，然后从该元素开始，逐层向上调整，确保堆的性质。 ``` ### 2.2 堆的删除和调整 #### 删除根节点 ```python def delete_root(heap): if len(heap) == 0: return None root = heap[0] heap[0] = heap.pop() heapify(heap, 0, len(heap)) return root ``` ``` 参数说明： - heap：待删除根节点的堆 ``` ``` 逻辑分析：将根节点与最后一个元素交换，然后从根节点开始，逐层向下调整，确保堆的性质。 ``` #### 调整堆 ```python def heapify(heap, i, n): left = 2 * i + 1 right = 2 * i + 2 largest = i if left < n and heap[left] > heap[i]: largest = left if right < n and heap[right] > heap[largest]: largest = right if largest != i: heap[i], heap[largest] = heap[largest], heap[i] heapify(heap, largest, n) ``` ``` 参数说明： - heap：待调整的堆 - i：待调整的节点索引 - n：堆的大小 ``` ``` 逻辑分析：比较当前节点与左右子节点，找出最大值，如果最大值不是当前节点，则交换当前节点与最大值，并递归调整最大值所在子树。 ``` ### 2.3 堆排序算法堆排序是一种基于堆的数据排序算法。其基本思想是： 1. 将待排序的数组构建成一个最大堆。 2. 将根节点与最后一个元素交换，然后调整堆，使根节点变为最大值。 3. 重复步骤 2，直到堆中只剩下一个元素。 ```python def heap_sort(arr): build_heap(arr) for i in range(len(arr) - 1, 0, -1): arr[i], arr[0] = arr[0], arr[i] heapify(arr, 0, i) ``` ``` 参数说明： - arr：待排序的数组 ``` ``` 逻辑分析：先将数组构建成堆，然后逐个将根节点与最后一个元素交换，并调整堆，最终得到一个从小到大排序的数组。 ``` # 3.1 数据流中位数问题 #### 3.1.1

最低0.47元/天解锁专栏

买1年送1年

点击查看下一篇

百万级高质量VIP文章无限畅学

千万级优质资源任意下载

C知道免费提问 ( 生成式Al产品 )

相关推荐

专栏简介

本专栏深入探讨了堆的数据结构，从基本概念和操作原理到各种应用场景。它涵盖了堆排序算法、优先队列、Top K 问题、滑动窗口最大值问题、连续中值问题等应用。此外，它还比较了堆与快速排序和二叉搜索树，分析了堆的构建方法和调整方法。专栏还介绍了堆在操作系统、定时任务调度和数据流中位数问题中的应用。它还探讨了堆的扩展应用，如外部排序算法和最小生成树算法。通过深入的分析和示例，本专栏旨在为读者提供对堆及其广泛应用的全面理解。

专栏目录

最低0.47元/天解锁专栏

买1年送1年

百万级高质量VIP文章无限畅学

千万级优质资源任意下载

C知道免费提问 ( 生成式Al产品 )

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

专栏目录

最低0.47元/天解锁专栏

买1年送1年

百万级高质量VIP文章无限畅学

千万级优质资源任意下载

C知道免费提问 ( 生成式Al产品 )

堆的应用之六：数据流中位数问题

相关推荐

Python中的堆实现：heapq 模块——利用堆结构实现快速访问数据流中的中位数

39.数据流中的中位数1

数据流中的中位数（priority_queue）1

flink计算数据流的中位数

295. 数据流的中位数c++

代码实现找出超出内存的数据流中位数，不能使用硬盘

从数据库读取ZS_Bank数据，计算招商银行前50000 用户现金流指标中位数

用R语言计算招商银行前5000名用户现金流指标中位数

画数据流图遇到的问题

flink中的数据流

专栏目录

最新推荐

激活函数理论与实践：从入门到高阶应用的全面教程

学习率对RNN训练的特殊考虑：循环网络的优化策略

【损失函数与随机梯度下降】：探索学习率对损失函数的影响，实现高效模型训练

Epochs调优的自动化方法

【实时系统空间效率】：确保即时响应的内存管理技巧

【算法竞赛中的复杂度控制】：在有限时间内求解的秘籍

极端事件预测：如何构建有效的预测区间

【批量大小与存储引擎】：不同数据库引擎下的优化考量

机器学习性能评估：时间复杂度在模型训练与预测中的重要性

时间序列分析的置信度应用：预测未来的秘密武器

专栏目录