深入浅出 Java 堆的管理--垃圾回收
引言
java 的堆是一个运行时数据区,类的实例(对象)从中分配空间。java 虚拟机(jvm)的堆中储存着正在运行的应用
程序所建立的所有对象,这些对象通过 new、newarray、anewarray 和 multianewarray 等指令建立,但是它们
不需要程序代码来显式地释放。一般来说,堆的是由垃圾回收 来负责的,尽管 jvm 规范并不要求特殊的垃圾回收
技术,甚至根本就不需要垃圾回收,但是由于内存的有限性,jvm 在实现的时候都有一个由垃圾回收所管理的堆。
垃圾回收是一种动态存储管理技术,它自动地释放不再被程序引用的对象,按照特定的垃圾收集算法来实现资源
自动回收的功能。
垃圾收集的意义
在c 中,对象所占的内存在程序结束运行之前一直被占用,在明确释放之前不能分配给其它对象;而在 java
中,当没有对象引用指向原先分配给某个对象的内存时,该内存便成为垃圾。jvm 的一个系统级线程会自动释放
该内存块。垃圾收集意味着程序不再需要的对象是无用信息,这些信息将被丢弃。当一个对象不再被引用的时候,
内存回收它占领的空间,以便空间被后来的新对象使用。事实上,除了释放没用的对象,垃圾收集也可以清除内
存记录碎片。由于创建对象和垃圾收集器释放丢弃对象所占的内存空间,内存会出现碎片。碎片是分配给对象的
内存块之间的空闲内存洞。碎片整理将所占用的堆内存移到堆的一端,jvm 将整理出的内存分配给新的对象。
垃圾收集能自动释放内存空间,减轻编程的负担。这使 java 虚拟机具有一些优点。首先,它能使编程效率
提高。在没有垃圾收集机制的时候,可能要花许多时间来解决一个难懂的存储器问题。在用 java 语言编程的时候,
靠垃圾收集机制可大大缩短时间。其次是它保护程序的完整性, 垃圾收集是 java 语言安全性策略的一个重要部
份。
垃圾收集的一个潜在的缺点是它的开销影响程序性能。java 虚拟机必须追踪运行程序中有用的对象, 而且最
终释放没用的对象。这一个过程需要花费处理器的时间。其次垃圾收集算法的不完备性,早先采用的某些垃圾收
集算法就不能保证 100%收集到所有的废弃内存。当然随着垃圾收集算法的不断改进以及软硬件运行效率的不断
提升,这些问题都可以迎刃而解。
垃圾收集的算法分析
java 语言规范没有明确地说明 jvm 使用哪种垃圾回收算法,但是任何一种垃圾收集算法一般要做 2 件基本的
事情:(1)发现无用信息对象;(2)回收被无用对象占用的内存空间,使该空间可被程序再次使用。
大多数垃圾回收算法使用了根集(root set)这个概念;所谓根集就量正在执行的 java 程序可以访问的引用变量
的集合(包括局部变量、参数、类变量),程序可以使用引用变量访问对象的属性和调用对象的方法。垃圾收集首
选需要确定从根开始哪些是可达的和哪些是不可达的,从根集可达的对象都是活动对象,它们不能作为垃圾被回
收,这也包括从根集间接可达的对象。而根集通过任意路径不可达的对象符合垃圾收集的条件,应该被回收。下
面介绍几个常用的算法。
1、引用计数法(reference counting collector)
引用计数法是唯一没有使用根集的垃圾回收得法,该算法使用引用计数器来区分存活对象和不再使用的对
象。一般来说,堆中的每个对象对应一个引用计数器。当每一次创建一个对象并赋给一个变量时,引用计数器置
为 1。当对象被赋给任意变量时,引用计数器每次加 1。当对象出了作用域后(该对象丢弃不再使用),引用计数器
减 1,一旦引用计数器为 0,对象就满足了垃圾收集的条件。
基于引用计数器的垃圾收集器运行较快,不会长时间中断程序执行,适宜地必须 实时运行的程序。但引用计
数器增加了程序执行的开销,因为每次对象赋给新的变量 ,计数器加 1,而每次现有对象出了作用域生,计数器
减 1。
2、tracing 算法(tracing collector)
tracing 算法是为了解决引用计数法的问题而提出,它使用了根集的概念。基于 tracing 算法的垃圾收集器从
根集开始扫描,识别出哪些对象可达,哪些对象不可达,并用某种方式标记可达对象,例如对每个可达对象设置
一个或多个位。在扫描识别过程中,基于 tracing 算法的垃圾收集也称为标记和清除(mark-and-sweep)垃圾收集