Skip to content

变量、作用域和内存问题

基本类型和引用类型的值

ECMAScript 变量可能包含两种不同数据类型的值:基本类型和引用类型值。基本类型指的是简单的数据段,而引用类型指那些可能由多个值构成的对象。

在将一个值赋给变量时,解析器必须确定这个值是基本类型值还是引用类型值。基本数据类型:Undefined, Null, Boolean, NumberString。这 5 种基本数据类型是按值访问的,因为可以操作保存在变量中的实际的值

引用类型的值是保存在内存中的对象。与其他语言不同,JavaScript 不允许直接访问内存中的位置,也就是说不能直接操作对象的内存空间。在操作对象时,当复制保存着对象的某个变量时,操作的是对象的引用。但在为对象添加属性时,操作的是实际的对象

动态的属性

定义基本类型值和引用类型值的方式是类似的:创建一个变量并为该变量赋值。但是,当这个值保存到变量中以后,对不同类型值可以执行的操作则大相径庭。对于引用类型的值,我们可以为其添加属性和方法,也可以改变和删除其属性和方法

复制变量值

除了保存的方式不同之外,在从一个变量向另一个变量复制基本类型值和引用类型值时,也存在不同。如果从一个变量向另一个变量复制基本类型的值,会在变量对象上创建一个新值,然后把该值复制到为新变量分配的位置上。

1
2
var num1 = 5;
var num2 = num1;

在此,num1 中保存的值是 5。当使用 num1 的值来初始化 num2 时,num2 中也保存了值 5。但 num2 中的 5 与 num1 中的 5 是完全独立的,该值只是 num1 中 5 的一个副本。此后,这两个变量可以参与任何操作而不会相互影响

当从一个变量向另一个变量复制引用类型的值时,同样也会将存储在变量对象中的值复制一份放到为新变量分配的空间中。不同的是,这个值的副本实际上是一个指针,而这个指针指向存储在堆中的一个对象。复制操作结束后,两个变量实际上将引用同一个对象。因此,改变其中一个变量,就会影响另一个变量

1
2
3
4
var obj1 = new Object()
var obj2 = obj1
obj1.name = 'hhh'
console.log(obj2.name) // 'hhh'

首先,变量 obj1 保存了一个对象的新实例。然后,这个值被复制到了 obj2 中;换句话说,obj1 和 obj2 都指向同一个对象。这样,当为 obj1 添加 name 属性后,可以通过 obj2 来访问这个属性,因为这两个变量引用的都是同一个对象。

1
2
3
4
5
6
7
var obj1 = new Object()
var obj2 = obj1
obj1 = {
  name: 'hhh',
  age: 10
}
console.log(obj2) // {}

传递参数

ECMAScript 中所有函数的参数都是按值传递的。也就是说,把函数外部的值复制到函数内部的参数,就和把值从一个变量复制到另一个变量一样。基本类型值的传递如同基本类型变量的复制一样,而引用类型的传递,则如同引用类型变量的复制一样。

在向参数传递基本类型的值时,被传递的值会被复制给一个局部变量(即命名参数,或者用 ECMAScript 的概念来说,就是arguments对象中的一个元素)。在向参数传递引用类型的值时,会把这个值在内存中的地址复制给一个局部变量,因此这个局部变量的变化会反映在函数的外部

1
2
3
4
5
6
function setName(obj) {
  obj.name = 'hhh'
}
var person = new Object()
setName(person)
console.log(person.name) // 'hhh'

以上代码中创建一个对象,并将其保存在了变量 person 中。然后,这个变量被传递到 setName() 函数中之后就被复制给了 obj。在这个函数内部,obj 和 person 引用的是同一个对象。换句话说,即使这个变量是按值传递的,obj 也会按引用来访问同一个对象。于是,当在函数内部为 obj 添加 name 属性后,函数外部的 person 也将有所反映;因为 person 指向的对象在堆内存中只有一个,而且是全局对象

有很多开发人员错误地认为:在局部作用域中修改的对象会在全局作用域中反映出来,就说明参数是按引用传递的。为了证明对象是按值传递的,我们再看一看下面这个经过修改的例子:

1
2
3
4
5
6
7
8
function setName(obj) {
  obj.name = 'hhh'
  obj = new Object()
  obj.name = 'ooo'
}
var person = new Object()
setName(person)
console.log(person.name) // 'hhh'

这个例子与前一个例子的唯一区别,就是在 setName() 函数中添加了两行代码:一行代码为 obj 重新定义了一个对象,另一行代码为该对象定义了一个带有不同值的 name 属性。在把 person 传递给 setName() 后,其 name 属性被设置为 'hhh'。然后,又将一个新对象赋给变量 obj,同时将其 name 属性设置为 'ooo'。

如果 person 是按引用传递的,那么 person 就会自动被修改为指向其 name 属性值为 'ooo' 的新对象。但是,当接下来再访问 person.name 时,显示的值仍然是 'hhh'。这说明即使在函数内部修改了参数的值,但原始的引用仍然保持未变。实际上,当在函数内部重写 obj 时,这个变量引用的就是一个局部对象了。而这个局部对象会在函数执行完毕后立即被销毁

检测类型

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
var s = 'hhh'
var b = true
var i = 22
var c = 2.2
var u;
var n = null
var o = new Object()
console.log(typeof s) //string
console.log(typeof b) //boolean
console.log(typeof i) //number
console.log(typeof c) //number
console.log(typeof u) //undefined
console.log(typeof n) // object
console.log(typeof o) //object

虽然在检测基本类型时 typeof 是非常得力的助手,但在检测引用类型的值时,这个操作符的用处不大。通常,我们并不是想知道某个值是对象,而是想知道它是什么类型的对象。
为此,ECMAScript 提供了instanceof操作符,其语法如下所示:

1
result = variable instanceof contructor

如果变量是给定引用类型的实例,那么instanceof操作符就会返回true

1
2
3
console.log(person instanceof Object); // 变量 person 是 Object 吗?
console.log(colors instanceof Array); // 变量 colors 是 Array 吗
console.log(pattern instanceof RegExp); // 变量 pattern 是 RegExp 吗

根据规定,所有引用类型的值都是 Object 的实例。因此,在检测一个引用类型值和 Object 构造函数时,instanceof 操作符始终会返回 true。当然,如果使用 instanceof 操作符检测基本类型的值,则该操作符始终会返回 false,因为基本类型不是对象

执行环境及作用域

执行环境(为简单起见,有时也称为"环境")是 JavaScript 中最为重要的一个概念。
执行环境定义了变量或函数有权访问的其他数据,决定了它们各自的行为。
每个执行环境都有一个与之关联的变量对象,环境中定义的所有变量和函数都保存在这个对象中。
虽然我们编写的代码无法访问这个对象,但解析器在处理数据时会在后台使用它

全局执行环境是最外围的一个执行环境。根据 ECMAScript 实现所在的宿主环境不同,表示执行环境的对象也不一样。
在 Web 浏览器中,全局执行环境被认为是window对象,因此所有全局变量和函数都是作为window对象的属性和方法创建的。
某个执行环境中的所有代码执行完毕后,该环境被销毁,保存在其中的所有变量和函数定义也随之销毁(全局执行环境直到应用程序退出--例如关闭网页或浏览器--时才会被销毁)

每个函数都有自己的执行环境
当执行流进入一个函数时,函数的环境就会被推入一个环境栈中。
而在函数执行之后,栈将其环境弹出,把控制权返回给之前的执行环境。
ECMAScript 程序中的执行流正是由这个方便的机制控制着

当代码在一个环境中执行时,会创建变量对象的一个作用域链
作用域链的用途,是保证对执行环境有权访问的所有变量和函数的有序访问。
作用域链的前端,始终都是当前执行的代码所在环境的变量对象。如果这个环境是函数,则将其活动对象作为变量对象。
活动对象在最开始时只包含一个变量,即arguments对象(这个对象在全局环境中是不存在的)。
作用域链中的下一个变量对象来自包含(外部)环境,而再下一个变量对象则来自下一个包含环境。
这样,一直延续到全局执行环境;
全局执行环境的变量对象始终都是作用域链中的最后一个对象

标识符解析是沿着作用域链一级一级地搜索标识符的过程。
搜索过程始终从作用域的前端开始,然后逐级地向后回溯,直至找到标识符为止(如果找不到标识符,通常会导致错误发生)

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
let color = "blue"

function changeColor() {
  if (color === 'blue') {
    color = 'red'
  } else {
    color = 'blue'
  }
}
changeColor()
console.log('Color is now ' + color)
// Color is now red

在这个简单的例子中,函数changeColor()的作用域包含两个对象:它自己的变量对象(其中定义着 arguments 对象)和全局环境的变量对象。
可以在函数内部访问变量 color,就是因为可以在这个作用域链中找到它

此外,在局部作用域中定义的变量可以在局部环境中与全局变量互换使用,如下面这个例子所示:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
let color = 'blue'
function changeColor() {
  let anotherColor = 'red'
  function swapColors() {
    let tempColor = anotherColor
    anotherColor = color
    color = tempColor
    // 这里可以访问 color、anotherColor 和 tempColor
  }
  // 这里可以访问 color 和 anotherColor,但不能访问 tempColor
  swapColors()
}
changeColor()

以上代码共涉及 3 个执行环境:全局环境、changeColor() 的局部环境和 swapColors() 的局部环境。
全局环境中有一个变量 color 和一个函数 changeColor()。
changeColor() 的局部环境中有一个名为 anotherColor 的变量和一个名为 swapColors() 的函数,但它也可以访问全局环境中的变量 color.
swapcolors() 的局部环境中有一个变量 tempColor,该变量只能在这个环境中访问到。
无论全局环境还是 changeColor() 的局部环境都无权访问 tempColor。
然而,在 swapColors() 内部则可以访问其他两个环境中的所有变量,因为那两个环境是它的父执行环境

这些环境之间的联系是线性的、有次序的。
每个环境都可以向上搜索作用域链,以查询变量和函数名;
但任何环境都不能通过向下搜索作用域链而进入另一个执行环境。

对于这个例子中的 swapColors() 而言,其作用域链中包含 3 个对象:swapColors() 的变量对象、changeColor() 的变量对象和全局变量对象。
swapColors() 的局部环境开始时会先在自己的变量对象中搜索变量和函数名,如果搜索不到则再搜索上一次作用链。
changeColor() 的作用域链中只包含两个对象:它自己的变量对象和全局变量对象。这也就是说,它不能访问 swapColors() 的环境

函数参数也被当作变量来对待,因此其访问规则与执行环境中的其他变量相同

延长作用域链

虽然执行环境的类型总共只有两种--全局和局部(函数),但还是有其他办法来延长作用域链。

这么说是因为有些语句可以在作用域链的前端临时增加一个变量,该变量会在代码执行后被移除。
在两种情况下会发生这种现象。
具体来说,就是当执行流进入下列任何一个语句时,作用域链就会得到加长

  • try-catch 语句的 catch 块
  • with 语句

这两个语句都会在作用域链的前端添加一个变量对象。
对 with 语句来说,会将指定的对象添加到作用域链中。
对 catch 语句来说,会创建一个新的变量对象,其中包含的是被抛出的错误对象的声明。下面看一个例子

1
2
3
4
5
6
7
function buildUrl() {
  var qs = "?debug=true"
  with (location) {
    var url = href + qs
  }
  return url
}

在此,with 语句接收的是 location 对象,因此其变量对象中就包含了 location 对象的所有属性和方法,而这个变量对象被添加到了作用域链的前端。
buildUrl() 函数中定义了一个变量 qs。
当在 with 语句中引用变量 href 时(实际上引用的是 location.href),可以在当前执行环境的变量对象中找到。
当引用变量 qs 时,引用的则是在 buildUrl() 中定义的那个变量,而该变量位于函数环境的变量对象中。
至于 with 语句内部,则定义了一个名为 url 的变量,因而 url 就成了函数执行环境的一部分,所以可以作为函数的值被返回

垃圾收集

JavaScript 具有自动垃圾收集机制,也就是说,执行环境会负责管理代码执行过程中使用的内存。
而在 C 和 C++ 之类的语言中,开发人员的一项基本任务就是手工跟踪内存的使用情况,这是造成很多问题的一个根源。
在编写 JavaScript 程序时,开发人员不用再关心内存使用问题,所需内存的分配以及无用内存的回收完全实现了自动管理。
这种垃圾收集机制的原理其实很简单:找出那些不再继续使用的变量,然后释放其占用的内存。
为此,垃圾收集器会按照固定的时间间隔(或代码执行中预定的收集时间),周期性地执行这一操作

下面我们来分析一下函数中局部变量的正常生命周期。
局部变量只在函数执行的过程中存在。
而在这个过程中,会为局部变量在栈(或堆)内存上分配相应的空间,以便存储它们的值。
然后在函数中使用这些变量,直至函数执行结束。
此时,局部变量就没有存在的必要了,因此可以释放它们的内存以供将来使用。
在这种情况下,很容易判断变量是否还有存在的必要;但并非所有情况下都这么容易就能得出结论
垃圾收集器必须跟踪哪个变量有用哪个变量没用,对于不再有用的变量打上标记,以备将来收回其占用的内存。
用于标识无用变量的策略可能会因实现而异,但具体到浏览器中实现,则通常有两个策略

标记清除

JavaScript 中最常用的垃圾收集方式是标记清除
当变量进入环境(例如,在函数中声明一个变量)时,就将这个变量标记为"进入环境"。
从逻辑上讲,永远不能释放进入环境的变量所占的内存,因为只要执行流进入相应的环境,就可能会用到它们。
而当变量离开环境时,则将其标记为"离开环境"

可以使用任何方式来标记变量。比如,可以通过翻转某个特殊的位来记录一个变量何时进入环境,或者使用一个“进入环境的”变量列表及一个“离开环境的”变量列表来跟踪哪个变量发生了变化。
说到底,如何标记变量其实并不重要,关键在于采取什么策略

垃圾收集器在运行的时候会给存储在内存中的所有变量都加上标记(当然,可以使用任何标记方式)。
然后,它会去掉环境中的变量以及被环境中的变量引用的变量的标记。
而在此之后再被加上标记的变量将被视为准备删除的变量,原因是环境中的变量已经无法访问到这些变量了。
最后,垃圾收集器完成内存清除工作,销毁那些带标记的值并回收它们所占用的内存空间

引用计数

另一种不太常见的垃圾收集策略叫做引用计数
引用计数的含义是跟踪记录每个值被引用的次数。
当声明了一个变量并将一个引用类型值赋给该变量时,则这个值的引用次数就是 1.
如果同一个值又被赋给另一个变量,则该值的引用次数加 1.
相反,如果包含对这个值引用的变量又取得了另外一个值,则这个值的引用次数减 1.
当这个值的引用次数变为 0 时,则说明没有办法再访问这个值了,因而就可以将其占用的内存空间回收回来。
这样,当垃圾收集器下次再运行时,它就会释放那些引用次数为 0 的值所占的内存

引用计数策略有一个很严重的问题:循环引用。循环引用指的是对象 A 中包含一个指向对象 B 的指针,而对象 B 中也包含一个指向对象 A 的引用。请看下面这个例子

1
2
3
4
5
6
7
function problem() {
  var objectA = new Object();
  var objectB = new Object();

  objectA.someOtherObject = objectB;
  objectB.anotherObject = objectA;
}

在这个例子中,objectA 和 objectB 通过各自的属性相互引用;也就是说,这两个对象的引用次数都是 2。
在采用标记清除策略的实现中,由于函数执行之后,这两个对象都离开了作用域,因此这种相互引用不是个问题。
但在采用引用计数策略的实现中,当函数执行完毕后,objectA 和 objectB 还将继续存在,因为它们的引用次数永远不会是 0.
假如这个函数被重复多次调用,就会导致大量内存得不到回收。

管理内存

使用具备垃圾收集机制的语言编写程序,开发人员一般不必操心内存管理的问题。但是,JavaScript 在进行内存管理及垃圾收集时面临的问题还是有点与众不同。
其中最主要的一个问题,就是分配给 Web 浏览器的可用内存数量通常要比分配给桌面应用程序的少。这样做的目的主要是出于安全方面的考虑,目的是防止 JavaScript 的网页耗尽全部系统内存而导致系统崩溃。
内存限制问题不仅会影响给变量分配内存,同时还会影响调用栈以及在一个线程中能够同时执行的语句数量

因此,确保占用最少的内存可以让页面获得更好的性能。而优化内存占用的最佳方式,就是为执行中的代码只保存必要的数据。一旦数据不再有用,最好通过将其值设置为 null 来释放其引用--这个做法叫做解除引用
这一做法适用于大多数全局变量和全局对象的属性。局部变量会在它们离开执行环境时自动被解除引用

1
2
3
4
5
6
7
8
9
function createPerson(name) {
  var localPerson = new Object();
  localPerson.name = name;
  return localPerson;
}
var globalPerson = createPerson('Nicholas');

// 手工解除 globalPerson 的引用
glbalPerson = null;

在这个例子中,变量globalPerson取得了createPerson()函数返回的值。
在 createPerson() 函数内部,我们创建了一个对象将其赋给局部变量 localPerson,然后又为该对象添加了一个名为 name 的属性。
最后,当调用这个函数时,localPerson 以函数值的形式返回并赋给全局变量 globalPerson。
由于 localPerson 在 createPerson() 函数执行完毕后就离开了其执行环境,因此无需我们显式地去为它解除引用。
但是对于全局变量 globalPerson 而言,则需要我们在不使用它的时候手工为它解除引用,这也正是上面例子中最后一行代码的目的

不过,解除一个值的引用并不意味着自动回收该值所占用的内存。
解除引用的真正作用是让值脱离执行环境,以便垃圾收集器下次运行时将其回收

小结

JavaScript 变量可以用来保存两种类型的值:基本类型值和引用类型值
基本类型的值源自以下 5 种基本数据类型:Undefined、Null、Booleam、Number 和 String。

基本类型值和引用类型值具有以下特点

基本类型值在内存中占据固定大小的空间,因此被保存在栈内存中
从一个变量向另一个变量复制基本类型的值,会创建这个值的一个副本
引用类型的值是对象,保存在堆内存中
包含引用类型值的变量实际上包含的并不是对象本身,而是一个指向该对象的指针
从一个变量向另一个变量复制引用类型的值,复制的其实是指针,因此两个变量最终都指向同一个对象
确定一个值是哪种基本类型可以使用 typeof 操作符,而确定一个值是哪种引用类型可以使用 instanceof 操作符

所有变量(包括基本类型和引用类型)都存在于一个执行环境(也称为作用域)当中。
这个执行环境决定了变量的生命周期,以及哪一部分代码可以访问其中的变量。
以下是关于执行环境的几点总结

执行环境有全局执行环境(也称为全局环境)和函数执行环境之分
每次进入一个新执行环境,都会创建一个用于搜索变量和函数的作用域链
函数的局部环境不仅有权访问函数作用域中的变量,而且有权访问其包含(父)环境,乃至全局环境
全局环境只能访问全局环境中定义的变量和函数,而不能直接访问局部环境中的任何数据
变量的执行环境有助于确定应该何时释放内存

JavaScript 是一门具有自动垃圾收集机制的编程语言,开发人员不必关心内存分配和回收问题。
可以对 JavaScript 的垃圾收集例程作如下总结

离开作用域的值将被自动标记为可以回收,因此将在垃圾收集期间被删除
“标记清除”是目前主流的垃圾收集算法,这种算法的思想是给当前不使用的值加上标记,然后再回收其内存
另一种垃圾收集算法是“引用计数”,这种算法的思想是跟踪记录所有值被引用的次数。JavaScript 引擎目前都不再使用这种算法;但在 IE 中访问非原生 JavaScript 对象(如 DOM 元素)时,这种算法仍然可能会导致问题
当代码中存在循环引用现象时,“引用计数”算法就会导致问题
解除变量的引用不仅有助于消除循环引用现象,而且对垃圾收集也有好处。为了确保有效地回收内存,应该及时解除不再使用的全局对象、全局对象属性以及循环引用变量的引用