垃圾回收gc --翻译

原文在https://developer.mozilla.org/en-US/docs/Web/JavaScript/Memory_Management.基本保持了平译,并在一些地方做了概念解释。(转载请注明出处)

介绍

高级语言，比如C，有底层的内存管理原语如malloc()和free()。但是对于Javascript来说，变量(string、object等等)被创建的时候分配内存，等变量不再被使用的时候，内存被"自动"释放。这个自动释放的过程叫做"垃圾回收"。“自动”这个词常使人困惑并且给了javascript(以及其他的高级语言)开发者他们不需要关心内存管理的印象。这是错误的。

内存生命周期

忽略具体的变成语言，内存的生命周期通常是这样的:

分配你需要的内存
使用他们(读、写操作)
当他们不再需要的时候释放他们

第二部分在所有的语言里都是明显的。第一和第三部分在低级语言里是明显的，但是在高级语言如JavaScript里是非常隐秘的。

JavaScript的内存分配

变量的初始化

为了不让程序的书写者操心内存分配问题，JavaScript随着变量的声明自动分配了内存。

var n = 123; //为1个数字分配了内存
var s = 'azerty';//为一个字符串分配了内存

var o = {
  a:1,
  b:null
};//为对象和里边的键值分配了内存

//(和对象一样),为数组和里边的元素分配了内存
var a = [1,null,'abra'];

function f(a){
  return a + 2;
}//为一个函数分配了内存(函数是可调用对象)

//函数表达式也作为1个对象被分配了内存
//译者注:函数的表达式指的是下面的匿名函数的定义部分,JavaScript的函数可以作为函数的参数传入，因为他是一种特殊的对象
someElement.addEventListener('click', function() {
  someElement.style.backgroundColor = 'blue';
}, false);

通过函数调用分配内存

一些函数调用的结果分配了内存

var d = new Date(); // 创建了一个Date对象，并分配了内存

var e = document.createElement('div'); // 创建了一个Dom元素，分配了内存

一些函数会分配新的变量或对象:

var s = 'azerty';
var s2 = s.substr(0, 3); // s2 是一个新的字符串
// 因为字符串是不可变对象, 
// JavaScript 可能不会再为s2分配内存, 而仅仅让s2记录0-3这个区间

var a = ['ouais ouais', 'nan nan'];
var a2 = ['generation', 'nan nan'];
var a3 = a.concat(a2); 
// 新的数组s3有4个元素,连接了a和a2

使用内存

使用内存基本上就是读写已分配的内存。比如读写变量的值，对象的属性，又或者给函数传递参数(译者:这里是说变量作为参数传递到函数的行为，就是使用这个变量内存的过程)。

当内存不再需要的时候释放

这个阶段会产生许多内存管理的问题。最难的问题是找到什么时候“已分配的内存不再需要”，这要求开发者去检测什么地方的内存不再需要，然后释放它们。

高级语言嵌入了一个叫做“垃圾回收”的功能，它的作用是追踪内存分配，当发现一块已分配的内存不再需要的时候，自动释放它。这是一个近似的过程，因为“判断一段内存是否还需要保留”是不可判定的(undecidable .can't be solved by an algorithm.这里可以理解为，分配的内存还用不用只有程序员主观的知道，如果他忘了，会导致内存泄漏，如果程序员手贱，释放的早了，再访问这块内存就会导致内存访问错误。语言的垃圾回收机制更像是一个第三者，虽然他很聪明，算法很强大，很能揣测程序意图，但是毕竟不是本人)。

引用

垃圾回收算法的主要理论依据是一个叫“引用”的概念。在内存管理的上下文中，如果一个对象有权利访问另一个对象(的内存，无论是显式还是隐式)，会让前者去引用后者。比如，Javascript对象有对他的原型隐式的引用，和对它属性显式的引用。

在内存管理的上下文中，“对象”的概念比通常的JavaScript的对象(Object)更为宽泛，甚至包含函数作用域，或者全局的词法作用域。

基于引用计数的垃圾回收

这是最简单的垃圾回收算法。这种算法将“一个内存中对象不再被需要”简化为"一个内存对象不再被别的对象引用"。如果一个对象被引用的数量为0，这个对象就被认为应该被回收了。(译者注:大多数此类算法都要求被管理的所有对象都有一个类似referenceCount的属性，标识自己被引用了多少次)。

例子:

var o = {
  a:{
    b:2
  }
};
//2个对象被创建出来，1给被引用为对象的属性，然后外部的对象被变量o引用。显然他们都不会被回收
var o2 = o;//变量o2又引用了o引用的对象
o = 1;//现在变量o不再引用之前的对象，之前的对象只被o2引用了
var oa = o2.a;//现在作为对象属性的对象，又被变量oa引用了
o2 = 'yo';//现在最初被o引用的对象已经再被引用了，可以被回收，但是它的a属性还被oa引用，所以还不能被释放
oa = null;//现在作为a属性的对象也不再被引用了，最初被o引用的对象可以被回收释放了。

限制:循环引用

当引用出现循环，这种算法就会出现限制。下面的例子里，2个对象被创建出来，并且彼此被另一个引用，导致循环引用。函数执行完成后，他们会离开函数作用域，不再起作用了，可以被释放了。但是，引用计数算法认为他们2个都被引用了一次(函数接收后，变量o,o2会解掉对对象的引用)，不能被回收。

function f() {
  var o = {};
  var o2 = {};
  o.a = o2; // o引用的对象的属性a 引用 o2
  o2.a = o; // o2引用的对象的属性a 引用 o

  return 'azerty';
}

f();

真实的例子

IE6和IE7使用引用计数管理DOM对象，所以循环引用是常见的导致内存泄漏的错误。

var div;
window.onload = function() {
  div = document.getElementById('myDivElement');
  div.circularReference = div;
  div.lotsOfData = new Array(10000).join('*');
};

这个例子里，dom元素"myDivElement"被自己的circularReference属性所引用(div.circularReference = div;)。如果这个属性没有明确的移除或者置为null,即使myDivElement这个元素从DOM树里移除了，引用计数垃圾收集器还将总是拥有至少一个这个元素的引用，并且一直存在于内存中。如果DOM元素持有大量数据(比如这个例子里的lotsOfData属性)，这个数据消耗的内存将不会被释放回收。

基于标记-清除的垃圾回收

这个算法将"一个内存中对象不再被需要"简化为"一个内存对象不可达"。(译者注:原文是an object is unreachable。内存中的对象，如果程序无法通过一些线索,如引用关系找到它，它就没有存在的意义,是不可达的)。这种算法假定知道一组叫做根的对象，周期性的从这些“根”开始，查找到所有被根引用的对象，然后从这些对象开始，递归的查找下去。因此，从根开始查找的过程中，垃圾收集器将会找到所有可达的内存对象和不可达的内存对象。

这个算法比上一个要好，因为“一个被0引用”的内存对象可以推导出这个内存对象不可达，相反，出现循环引用的时候，反推却不成立。

截止2012年，所有的现代浏览器都搭载了标记-清除垃圾回收器。过去几年里，JavaScript 的垃圾回收领域(分代/增量/并发/并行垃圾回收)技术的更新实现了这种算法的进步，但是对垃圾回收算法本身:什么时候"一个内存对象不再需要"这个概念的处理，并没有多大进步。(原文:but not improvements over the garbage collection algorithm itself nor its reduction of the definition of when "an object is not needed anymore).

循环引用不再是问题

第一个例子里，函数结束后，2个对象不再被由全局对象可达的对象所引用，因此，他们被垃圾回收器认为是不可达的。

限制:内存对象需要被显式的设置为不可达

即使这被标注为一个限制，但是在实践中很少遇到，这也是为什么很少有人会经常关注垃圾收集的原因(说的是,在当前标记清除的技术下，程序员们不再关注垃圾回收这个问题了)。