实现 JavaScript 中的 Promise
Promise 类似于一个容器,里面保存着某个未来才会结束的事件(通常是一个异步操作)的结果。Promise 是一个对象,从它可以获取异步操作的消息。Promise 提供统一的 API,各种异步操作都可以用同样的方法进行处理。
“回调地狱” 的解决方案
Promise 是处理异步编码的一个解决方案,在 Promise 出现以前,异步代码的编写都是通过回调函数来处理的,虽然单层回调代码相当直观,但多次回调就显得比较复杂,被称为 回调地狱 。
1 | const fs = require('fs'); |
由于回调代码必须作为参数传递给调用函数,所以很容易出现这种回调穿插回调的代码,可读性不高。
为了解决这个问题,引入了 Promise
对象,Promise
作为一个容器,接受一个未来会发生的事件。它有三个状态 pending
(进行中)、fulfilled
(已成功)和 rejected
(已失败)。只有异步操作的结果,可以决定当前是哪一种状态,任何其他操作都无法改变这个状态。一旦状态改变,就不会再变,任何时候都可以得到这个结果。Promise
对象的状态改变,只有两种可能:从 pending
变为 fulfilled
和从 pending
变为 rejected
。只要这两种情况发生,状态就凝固了,不会再变了,会一直保持这个结果,这时就称为 resolved(已定型)。如果改变已经发生了,你再对 Promise
对象添加回调函数,也会立即得到这个结果。这与事件(Event)完全不同,事件的特点是,如果你错过了它,再去监听,是得不到结果的。
Promise
对象构造函数接受一个函数作为参数,该函数有两个参数,resolve
和 reject
。这两个函数由 Promise 的实现库来提供。resolve
函数的作用是,将 Promise
对象的状态从 “未完成” 变为 “成功”(即从 pending 变为 resolved),在异步操作成功时调用,并将异步操作的结果,作为参数传递出去;reject
函数的作用是,将 Promise
对象的状态从 “未完成” 变为 “失败”(即从 pending 变为 rejected),在异步操作失败时调用,并将异步操作报出的错误,作为参数传递出去。
1 | const promise = new Promise(function(resolve, reject) { |
实现一个 Promise
基本结构
为了实现 Promise,Promise 对象需要一个状态指示器 state
,一个 value
代表要传递的数据,一个 reason
代表错误原因。还有 resolve
和 reject
函数作为状态转换函数。
1 | function Promise(executor) { |
实现执行器函数 executor
Promise 对象就是为了立即执行传入的 executor,这个 executor 返回一个异步结果。
1 | let p = new Promise((resolve, reject) => { |
实现立即执行
1 | function Promise(executor) { |
实现状态更新函数 resolve 和 reject
只有 pending
状态才可以更新,resolve
和 reject
需要实现这一点。
1 | function resolve(value) { |
实现 then 方法和链式调用
then
方法用于处理异步返回结果,定义在 prototype
上。then
需要实现的是,根据不同的 Promise
状态来进行不同的 “回调” 操作。
1 | Promise.prototype.then = function (onFulfilled, onRejected) { |
Promise 的链式调用的关键在于 then
方法返回一个 Promise
对象,这样就可以继续 then ()
,规范有
- 每个 then 方法都返回一个新的 Promise 对象( 原理的核心 )
- 如果 then 方法中显示地返回了一个 Promise 对象就以此对象为准,返回它的结果
- 如果 then 方法中返回的是一个普通值(如 Number、String 等)就使用此值包装成一个新的 Promise 对象返回。
- 如果 then 方法中没有 return 语句,就视为返回一个用 Undefined 包装的 Promise 对象
- 若 then 方法中出现异常,则调用失败态方法(reject)跳转到下一个 then 的 onRejected
- 如果 then 方法没有传入任何回调,则继续向下传递(值的传递特性)。
第三点:如果 then 方法中返回的是一个普通值(如 Number、String 等)就使用此值包装成一个新的 Promise 对象返回。
1 | let p =new Promise((resolve,reject)=>{ |
第四点,如果 then 方法中没有 return 语句,就视为返回一个用 Undefined 包装的 Promise 对象
1 | let p = new Promise((resolve, reject) => { |
第六点,如果 then 方法没有传入任何回调,则继续向下传递,这就是 Promise 中值的穿透
1 | let p = new Promise((resolve, reject) => { |
在第一个 then 方法之后连续调用了两个空的 then 方法 ,没有传入任何回调函数,也没有返回值,此时 Promise 会将值一直向下传递,直到接收处理它,这就是所谓的值的穿透。
实现异步 executor 支持
设想如果 executor
中包含异步过程
1 | let p = new Promise((resolve, reject) => { |
代码不输出任何结果,原因是 setTimeout
函数使得 resolve
是异步执行的,有延迟,当调用 then
方法的时候,此时此刻的状态还是等待态(pending),因此 then 方法即没有调用 onFulfilled
也没有调用 onRejected
。
需要做到的事 then
方法执行时,如果还在 Promise 处于 pending 状态,那么把回调函数 push 到一个回调队列中,状态发生改变了就依次从该队列中取出执行。用 Array 来实现。
1 | function Promise(executor) { |
实现 then
的回调队列。
1 | Promise.prototype.then = function (onFulfilled, onRejected) { |
寄存好了回调,接下来就是当状态改变时执行就好了:
1 | function resolve(value) { |
至此,Promise 已经支持了异步操作,setTimeout 延迟后也可正确执行 then 方法返回结果。
实现
搞清楚了这些点,我们就可以动手实现 then 方法的链式调用,一起来完善它:
1 | Promise.prototype.then = function (onFulfilled, onRejected) { |
首先,不论何种情况 then 都返回 Promise 对象,我们就实例化一个新 promise2 并返回。
接下来就处理根据上一个 then 方法的返回值来生成新 Promise 对象,由于这块逻辑较复杂且有很多处调用,我们抽离出一个方法来操作,这也是规范中说明的:
1 | /** |
resolvePromise
方法用来封装链式调用产生的结果,下面我们分别一个个情况的写出它的逻辑,首先规范中说明,如果 promise2
和 x
指向同一对象,就使用 TypeError 作为原因转为失败。原文如下:
If promise and x refer to the same object, reject promise with a TypeError as the reason.
这是什么意思?其实就是循环引用,当 then 的返回值与新生成的 Promise 对象为同一个(引用地址相同),则会抛出 TypeError 错误:
1 | let promise2 = p.then(data => { |
运行结果:
1 | TypeError: Chaining cycle detected for promise #<Promise> |
很显然,如果返回了自己的 Promise 对象,状态永远为等待态(pending),再也无法成为 resolved 或是 rejected,程序会死掉,因此首先要处理它:
1 | function resolvePromise(promise2, x, resolve, reject) { |
接下来就是分各种情况处理。当 x
就是一个 Promise,那么就执行它,成功即成功,失败即失败。若 x
是一个对象或是函数,再进一步处理它,否则就是一个普通值:
1 | function resolvePromise(promise2, x, resolve, reject) { |
此时规范中说明,若是个对象,则尝试将对象上的 then 方法取出来,此时如果报错,那就将 promise2 转为失败态。原文:
If retrieving the property x.then results in a thrown exception e, reject promise with e as the reason.
1 | function resolvePromise(promise2, x, resolve, reject) { |
多说几句,为什么取对象上的属性有报错的可能?Promise 有很多实现(bluebird,Q 等),Promises/A + 只是一个规范,大家都按此规范来实现 Promise 才有可能通用,因此所有出错的可能都要考虑到,假设另一个人实现的 Promise 对象使用 Object.defineProperty ()
恶意的在取值时抛错,我们可以防止代码出现 Bug。
此时,如果对象中有 then,且 then 是函数类型,就可以认为是一个 Promise 对象,之后,使用 x
作为 this 来调用 then 方法。
If then is a function, call it with x as this
1 | // 其他代码略... |
这样链式写法就基本完成了。但是还有一种极端的情况,如果 Promise 对象转为成功态或是失败时传入的还是一个 Promise 对象,此时应该继续执行,直到最后的 Promise 执行完。
1 | p.then(data => { |
此时就要使用递归操作了。
规范中原文如下:
If a promise is resolved with a thenable that participates in a circular thenable chain, such that the recursive nature of [Resolve] eventually causes [Resolve] to be called again, following the above algorithm will lead to infinite recursion. Implementations are encouraged, but not required, to detect such recursion and reject promise with an informative TypeError as the reason.
很简单,把调用 resolve 改写成递归执行 resolvePromise 方法即可,这样直到解析 Promise 成一个普通值才会终止,即完成此规范:
1 | // 其他代码略... |
到此,链式调用的代码已全部完毕。在相应的地方调用 resolvePromise
方法即可。
测试
其实,写到此处 Promise 的真正源码已经写完了,但是距离 100 分还差一分,是什么呢?
规范中说明,Promise 的 then 方法是异步执行的。
onFulfilled or onRejected must not be called until the execution context stack contains only platform code.
ES6 的原生 Promise 对象已经实现了这一点,但是我们自己的代码是同步执行,不相信可以试一下,那么如何将同步代码变成异步执行呢?可以使用 setTimeout 函数来模拟一下:
1 | setTimeout(()=>{ |
利用此技巧,将代码 then 执行处的所有地方使用 setTimeout 变为异步即可,举个栗子:
1 | setTimeout(() => { |
可以利用 promises-aplus-tests 来测试代码