要理解 V8 的工作原理,你需要搞清楚一些概念和原理,比如接下来我们会从编译器(Compiler)、解释器(Interpreter)、抽象语法树(AST)、字节码(Bytecode)、即时编译器(JIT)概念来解释V8 是怎么工作的、如何执行JavaSCript的
编译器(Compiler)和解释器(Interpreter)
之所以存在编译器和解释器,是因为机器不能直接理解我们所写的代码,所以在执行程序之前,需要将我们所写的代码“翻译”成机器能读懂的机器语言。按语言的执行流程,可以把语言划分为编译型语言和解释型语言。
编译型语言在程序执行之前,需要经过编译器的编译过程,并且编译之后会直接保留机器能读懂的二进制文件,这样每次运行程序时,都可以直接运行该二进制文件,而不需要再次重新编译了。比如 C/C++、GO 等都是编译型语言。
而由解释型语言编写的程序,在每次运行时都需要通过解释器对程序进行动态解释和执行。比如 Python、JavaScript 等都属于解释型语言。
- 在编译型语言的编译过程中,编译器首先会依次对源代码进行词法分析、语法分析,生成抽象语法树(AST),然后是优化代码,最后再生成处理器能够理解的机器码。如果编译成功,将会生成一个可执行的文件。但如果编译过程发生了语法或者其他的错误,那么编译器就会抛出异常,最后的二进制文件也不会生成成功。
- 在解释型语言的解释过程中,同样解释器也会对源代码进行词法分析、语法分析,并生成抽象语法树(AST),不过它会再基于抽象语法树生成字节码,最后再根据字节码来执行程序、输出结果。
抽象语法树(AST)
关于 AST
(抽象语法树) 相信很多小伙伴多不陌生了,或多或少都有听说过吧。我们将重点讲解下抽象语法树(AST ),看看什么是 AST 以及 AST 的生成过程是怎样的。其实这和渲染引擎将 HTML 格式文件转换为计算机可以理解的 DOM 树的情况类似。如果你想要自己体验一下写的代码会被解释成AST之后是什么样的,这里有个地址,你可以上这里体验一下[点这里]。(https://astexplorer.net/)
生成 AST 需要经过两个阶段
- 分词(tokenize),又称为词法分析,其作用是将一行行的源码拆解成一个个 token。所谓token,指的是语法上不可能再分的、最小的单个字符或字符串。
- 解析(parse),又称为语法分析,其作用是将上一步生成的 token 数据,根据语法规则转为 AST。如果源码符合语法规则,这一步就会顺利完成。但如果源码存在语法错误,这一步就会终止,并抛出一个“语法错误”。
比如 var str = "hello world"
,这是一个变量声明,在 AST
中就是 VariableDecalator
, 像函数执行之类的就是 ExpressionStatement
, Expression 中会有细分项,如( CallExpression
等) Identifier
是 str
, "hello world"
是 Literal
。
像 Babel
和 ESLint
的原理都是利用了 AST
来实现的:
Babel
的工作原理就是先将 ES6
源码转换为 AST
,然后再将 ES6
语法的 AST
转换为 ES5
语法的 AST
,最后利用 ES5
的 AST
生成 JavaScript
源代码。
ESLint
是一个用来检查 JavaScript
编写规范的插件,其检测流程也是需要将源码转换为 AST
,然后再利用 AST
来检查代码规范化的问题。
字节码(Bytecode)
通常,如果有一段第一次执行的字节码,解释器 (Ignition)会逐条解释执行。在执行字节码的过程中,如果发现有热点代码(HotSpot:比如一段代码被重复执行多次,这种就称为热点代码),那么后台的编译器 (TurboFan) 就会把该段热点的字节码编译为高效的机器码,然后当再次执行这段被优化的代码时,只需要执行编译后的机器码就可以了,这样就大大提升了代码的执行效率。
其实字节码配合解释器和编译器是最近一段时间很火的技术,比如 Java 和 Python 的虚拟机也都是基于这种技术实现的,我们把这种技术称为即时编译(JIT)。具体到 V8
,就是指解释器 Ignition
在解释执行字节码的同时,收集代码信息,当它发现某一部分代码变热了之后,TurboFan 编译器
便闪亮登场,把热点的字节码转换为机器码,并把转换后的机器码保存起来,以备下次使用。
对于 JavaScript 工作引擎,除了 V8 使用了“字节码 +JIT”技术之外,苹果的 SquirrelFish Extreme 和 Mozilla 的 SpiderMonkey 也都使用了该技术。对于 JavaScript
工作引擎,除了 V8
使用了**“字节码 +JIT”**技术之外,苹果的 SquirrelFish Extreme
和 Mozilla
的 SpiderMonkey
也都使用了该技术。
相信下面这张图可以帮助你理解。
JavaScript 的性能优化
到这里相信你现在已经了解 V8 是如何执行一段 JavaScript 代码的了。在过去几年中,JavaScript 的性能得到了大幅提升,这得益于 V8 团队对解释器和编译器的不断改进和优化。
虽然在 V8 诞生之初,也出现过一系列针对 V8 而专门优化 JavaScript 性能的方案,比如隐藏类、内联缓存等概念都是那时候提出来的。不过随着 V8 的架构调整,你越来越不需要这些微优化策略了,相反,对于优化 JavaScript 执行效率,你应该将优化的中心聚焦在单次脚本的执行时间和脚本的网络下载上,主要关注以下三点内容:
- 提升单次脚本的执行速度,避免 JavaScript 的长任务霸占主线程,这样可以使得页面快速响应交互;
- 避免大的内联脚本,因为在解析 HTML 的过程中,解析和编译也会占用主线程;
- 减少 JavaScript 文件的容量,因为更小的文件会提升下载速度,并且占用更低的内存。
总的来说,就是减少 JavaScript 代码长时间霸占线程。