【Java集合类源码精讲】：HashMap与HashSet工作机制深度解读

![【Java集合类源码精讲】：HashMap与HashSet工作机制深度解读](https://iq.opengenus.org/content/images/2019/04/hash_map_flow.jpg) # 1. Java集合框架概述 Java集合框架是Java编程语言中用于存储和操作对象的集合的一组接口和类。这些集合类和接口是Java编程中不可或缺的一部分，它们为处理动态数据提供了基础支撑。集合框架允许开发者以统一的方式操作不同类型的数据集合，无需关心数据存储的具体细节。在处理大量数据时，使用集合框架可以显著提高代码的效率和可维护性。本章将为读者概述Java集合框架的基本结构，其中包括List、Set、Queue等主要接口，以及对应的ArrayList、LinkedList、HashSet、TreeSet等实现类。此外，我们会介绍如何选择合适的集合类型来满足特定需求，以及如何在集合框架中迭代、排序和搜索元素。通过对集合框架的初步了解，读者将为深入探索其内部机制和高级特性打下坚实的基础。 # 2. 深入理解HashMap机制 ## 2.1 HashMap的数据结构 ### 2.1.1 数组与链表的结合在Java中，HashMap是基于散列的，它使用数组和链表结合的方式实现了数据的存储。散列是一个将任意长度的输入通过散列算法变换成固定长度的输出，这个输出值称为散列值。HashMap内部维护了一个数组，而数组的每一个元素是一个链表，用来解决散列冲突。具体来说，当有两个或多个键（key）的散列值相同时，这些键值对就会被存储在同一个数组位置上的链表中。在分析这部分代码之前，我们来看一个简单的HashMap结构的示意图： ```java // 伪代码 - 描述HashMap内部数据结构 class HashMap { Node<K,V>[] table; // 数组，存储节点的数组 static class Node<K,V> { final int hash; // 用于计算存储位置 final K key; V value; Node<K,V> next; // 指向下一个节点，形成链表 } } ``` ### 2.1.2 散列冲突与处理散列冲突是指不同的输入值通过散列函数计算得到相同的输出值。在HashMap中，处理散列冲突的方法就是使用链地址法。即当有新的键值对插入时，计算其散列值，如果该位置已经存在节点，就将新的节点以链表节点的形式追加到该位置。 ```java // 伪代码 - 描述HashMap put操作中处理散列冲突的部分 public V put(K key, V value) { return putVal(hash(key), key, value, false, true); } // 伪代码 - putVal方法中的散列冲突处理 final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { Node<K,V>[] tab; Node<K,V> p; int n, i; if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; // 扩容或初始化数组 if ((p = tab[i = (n - 1) & hash]) == null) // 计算索引位置 tab[i] = newNode(hash, key, value, null); else { Node<K,V> e; K k; if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p; else if (p instanceof TreeNode) e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); else { for (int binCount = 0; ; ++binCount) { if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); // 链表添加节点 if (binCount >= TREEIFY_THRESHOLD - 1) treeifyBin(tab, hash); break; } if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; } } if (e != null) { V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); return oldValue; } } ++modCount; if (++size > threshold) resize(); afterNodeInsertion(evict); return null; } ``` 在以上伪代码中，我们可以看到，当新的键值对的散列值与已有的节点散列值相同，并且key也相同时，会执行替换操作。如果仅散列值相同，但key不同，则会将新的节点添加到链表的尾部，这样就处理了散列冲突。 ## 2.2 HashMap的初始化与扩容 ### 2.2.1 初始容量与加载因子 HashMap在初始化时，可以指定其内部数组的初始容量（Initial Capacity），默认为16。加载因子（Load Factor）是用来衡量HashMap满的程度，其默认值为0.75。加载因子越高，空间利用率越高，但冲突的机会也越高；加载因子越低，冲突机会越小，空间利用率越低，但可能减少冲突。当HashMap中的节点数（元素个数）超过了加载因子与当前容量的乘积时，HashMap就会进行扩容。 ### 2.2.2 扩容机制详解当HashMap中的元素数量超过阈值threshold时，就会触发扩容。扩容是一个相对昂贵的操作，因为它需要重新计算每个元素的存储位置。在Java 8中，HashMap的扩容不再是简单的两倍扩大，而是通过resize()方法将数组的长度变为原来的两倍，同时进行rehash操作。 ```java // 伪代码 - 描述HashMap的扩容 final Node<K,V>[] resize() { Node<K,V>[] oldTab = table; int oldCap = (oldTab == null) ? 0 : oldTab.length; int oldThr = threshold; int newCap, newThr = 0; if (oldCap > 0) { if (oldCap >= MAXIMUM_CAPACITY) { threshold = Integer.MAX_VALUE; return oldTab; } else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) newThr = oldThr << 1; // 双倍扩容，新的阈值是原来的两倍 } else if (oldThr > 0) newCap = oldThr; else { // 默认构造函数 newCap = DEFAULT_INITIAL_CAPACITY; newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); } if (newThr == 0) { float ft = (float)newCap * loadFactor; newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE); } threshold = newThr; @SuppressWarnings({"rawtypes","unchecked"}) Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; table = newTab; if (oldTab != null) { for (int j = 0; j < oldCap; ++j) { Node<K,V> e; if ((e = oldTab[j]) != null) { oldTab[j] = null; if (e.next == null) newTab[e.hash & (newCap - 1)] = e; else if (e instanceof TreeNode) ((TreeNode<K,V>)e).split(this, newTab, j, oldCap); else { // preserve order Node<K,V> loHead = null, loTail = null; Node<K,V> hiHead = null, hiTail = null; Node<K,V> next; do { next = e.next; if ((e.hash & oldCap) == 0) { if (loTail == null) loHead = e; else loTail.next = e; loTail = e; } else { if (hiTail == null) hiHead = e; else hiTail.next = e; hiTail = e; } } while ((e = next) != null); if (loTail != null) { loTail.next = null; newTab[j] = loHead; } if (hiTail != null) { hiTail.next = null; newTab[j + oldCap] = hiHead; } } } } } return newTab; } ``` 上述伪代码展示了resize方法的主要逻辑。它首先检查旧的容量，然

最低0.47元/天解锁专栏

送3个月

百万级高质量VIP文章无限畅学

千万级优质资源任意下载

C知道免费提问 ( 生成式Al产品 )

相关推荐

SW_孙维

开发技术专家

知名科技公司工程师，开发技术领域拥有丰富的工作经验和专业知识。曾负责设计和开发多个复杂的软件系统，涉及到大规模数据处理、分布式系统和高性能计算等方面。

专栏简介

本专栏深入探讨 Java 高级数据结构，旨在帮助开发者提升 Java 编程技能。专栏文章涵盖广泛主题，包括： * 优化 ArrayList 和 LinkedList 的技巧 * Map、Set 和 List 的工作机制 * TreeMap 和 TreeSet 的高效场景分析 * ConcurrentHashMap 和 CopyOnWriteArrayList 的并发数据结构 * BitSet 和 EnumSet 的性能提升秘诀 * HashMap 和 HashSet 的源码解读 * 图结构在 Java 中的实现和优化 * Stack 和 Queue 的实际应用技巧 * BlockingQueue 的使用场景优化 * 选择合适的集合类型的最佳实践 * Java 中的红黑树 * Collections 工具类的同步包装器 * Trie 树提升字符串检索效率 * BloomFilter 原理和应用场景 * ArrayList 动态数组原理 * ConcurrentSkipListMap 和 ConcurrentSkipListSet 的深入探讨通过阅读本专栏，开发者可以深入了解 Java 数据结构，掌握优化技巧，并提升并发编程能力，从而编写高效、可靠的 Java 程序。

专栏目录

最低0.47元/天解锁专栏

送3个月

百万级高质量VIP文章无限畅学

千万级优质资源任意下载

C知道免费提问 ( 生成式Al产品 )

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

专栏目录

最低0.47元/天解锁专栏

送3个月

百万级高质量VIP文章无限畅学

千万级优质资源任意下载

C知道免费提问 ( 生成式Al产品 )

【Java集合类源码精讲】：HashMap与HashSet工作机制深度解读

相关推荐

Java集合框架源码剖析：HashSet 和 HashMap

java集合类源码分析之Set详解

对java基础集合部分（List、HashMap、HashSet、ArrayList等）底层源码的分析与总结

第1关：学习-java集合类之map的hashmap之常用方法的使用

hashmap与hashset

java hashmap hashtable hashset

java集合类之map的hashmap

HashMap与HashSet之间的区别

学习-java集合类之map的hashmap之常用方法的使用

java集合类之map的hashmap之常用方法的使用

专栏目录

最新推荐

Image Processing and Computer Vision Techniques in Jupyter Notebook

Technical Guide to Building Enterprise-level Document Management System using kkfileview

Expert Tips and Secrets for Reading Excel Data in MATLAB: Boost Your Data Handling Skills

Analyzing Trends in Date Data from Excel Using MATLAB

Parallelization Techniques for Matlab Autocorrelation Function: Enhancing Efficiency in Big Data Analysis

[Frontier Developments]: GAN's Latest Breakthroughs in Deepfake Domain: Understanding Future AI Trends

Styling Scrollbars in Qt Style Sheets: Detailed Examples on Beautifying Scrollbar Appearance with QSS

PyCharm Python Version Management and Version Control: Integrated Strategies for Version Management and Control

Installing and Optimizing Performance of NumPy: Optimizing Post-installation Performance of NumPy

Statistical Tests for Model Evaluation: Using Hypothesis Testing to Compare Models

专栏目录