nodejs 回调函数寻技术

回调，是非常基本的概念，尤其在现今NodeJS诞生与蓬勃发展中变得更加被人们重视。

很多朋友学NodeJS，学很久一直摸不着门道，觉得最后在用Express写Web程序，有这样的感觉只能说明没有学懂NodeJS，本质上说不理解回调，就不理解NodeJS。

NodeJS有三大核心：

- CallBack回调

- Event事件

- Stream流

先来看什么不叫回调，下面是很多网友误认为的回调：

复制代码

//代码示例

//Foo函数意在接收两个参数，任意类型a，和函数类型cb，在结尾要调用cb()

function Foo(a, cb){

console.log(a);

// do something else

// Maybe get some parameters for cb

var param = Math.random();

cb(param);

}

//定义一个叫CallBack的函数，将作为参数传给Foo

var CallBack = function(num){

console.log(num);

}

//调用Foo

Foo(2, CallBack);

复制代码

以上代码不是回调，以下指出这里哪些概念容易混淆：

- 变量CallBack，被赋值为一个匿名函数，但是不因为它名字叫CallBack，就称知为回调

_ Foo函数的第二个形式参数名为cb，同理叫cb，和是不是回调没关系

_ cb在Foo函数代码最后被以cb(param)的形式调用，不因为cb在另一个函数中被调用，而将其称之为回调

直白来讲，以上代码就是普通的函数调用，唯一特殊一点的地方是，因为JS有函数式语言的特性，可以接收函数作为参数。在C语言里可以用指向函数的指针来达到类似效果。

讲到这里先停一下，大家注意到本文的标题是解读异步、回调和EventLoop，回调之前还有异步呢，这个顺序对于理解很有帮助，可以说理解回调的前提，是理解异步。

说到异步，什么是异步呢？和分布、并行有什么区别？

回归原始，追根溯源是我们学习编程的好方法，不去想有什么高级的工具和概念，而去想如果我们只有一个浏览器做编译器和一个记事本，用plain JS写一段异步代码，怎么写？不能用事件系统，不能用浏览器特性。

小明：刚才上面那段代码是异步的吗？

老袁：当然不是，即便把Foo改为AsyncFoo也不是。这里比较迷惑的是cb(param)是在Foo函数的最后被调用的。

小明：好像觉得异步的代码，确实应该在最后调一个callback函数，因为之后的代码不会被执行到了。

老袁：异步的一个定义是函数调用不返回原来代码调用处，而cb(params)调用完后，依旧返回到Foo的尾部，即便cb(params)后还有代码，它们也可以被执行到，这是个同步调用。

Plain JS 异步的写法有很多，以经典的为例：

复制代码

//代码示例

// ====同步的加法

function Add(a, b){

return a+b;

}

Add(1, 2) // => 3

// ====异步的加法

function LazyAdd(a){

return function(b){

return a+b;

}

var result = LazyAdd(1); // result等于一个匿名函数，实际是闭包

//我们的目的是做一个加法，result中保存了加法的一部分，即第一个参数和之后的运算规则，

//通过返回一个持有外层参数a的匿名函数构成的闭包保存至变量result中，这部是异步的关键。

//极端的情况var result = LazyAdd(1)(2);这种极端情况又不属于异步了，它和同步没有区别。

// 现在可以写一些别的代码了

console.log('wait some time, doing some fun');

// 实际生产中不会这么简单，它可能在等待一些条件成立，再去执行另外一半。

result = result(2) // => 3

复制代码

上述代码展示了，最简单的异步。我们要强调的事，异步是异步，回调是回调，他俩半毛钱关系都没有。

Ok，下面把代码改一改，看什么叫回调：

复制代码

//代码示例

//注意还是那个Add，精髓也在这里，随后说到

function Add(a, b){

return a+b;

}

//LazyAdd改变了，多了一个参数cb

function LazyAdd(a, cb){

return function(b){

cb(a, b);

}

//将Add传给形参cb

var result = LazyAdd(1, Add)

// doing something else

result = result(2); // => 3

复制代码

这段代码，看似简单，实则并不平凡。

小明：这代码给人的第一感觉就是脱裤子放屁，明明一个a+b，先是变成异步的写法就多了很多代码，人都看不懂了，现在的这个加了所谓的“回调”，更啰嗦了，最后得到的结果都是1+2=3，尼玛这不有病吗？

老袁：你只看到了结果，却不知道为什么人家这么写，这样写为了什么。代码示例和中，同样的Add函数，作为参数传到LazyAdd中，此时它是回调。那为什么代码示例中，Foo中传入的cb不是回调呢？要仔细体会这句话，需要带状态的才叫回调函数，own state，这里通过闭包保存的a就是状态。

小明：我伙呆

老袁：现在再说为什么要有回调，单看输出结果，回调除了啰嗦和难于理解之外没有任何意义。但是！！！

现在说吧，CallBack的好处是：保证API不撕裂

也就是说，异步是很有需求的，处理的好能使计算效率提高，不至于卡在某处一直等待。但是异步的写法，我们看到了非常难看，把一个加法变成异步，都如此难看，何况其他。那么CallBack的妙处就是“保证API不撕裂”，代码中写到的精髓所在，还是那个Add，对，让程序员在写异步程序的时候，还能够像同步写法那样好理解，Add作为CallBack传入，保证的是Add这个方法好理解，作为API设计中的重要一个环节，保证开发者用起来方便，代码可读性高。

以NodeJS的readFile API为例进一步说明：

fs.readFile(filename, [options], callback)

有两个必填的参数filename和callback

callback是实际程序员要写代码的地方，写它的时候假设文件已经读取到了，该怎么写还怎么写，是API历史上的一次大进步。

//读取文件'etc/passwd',读取完成后将返回值，传入function(err, data) 这个回调函数。

fs.readFile('/etc/passwd', function (err, data) {

if (err) throw err;

console.log(data);

});

回调和闭包有一个共同的特性：在最终“回调 ”调用以前，前面所有的状态都得存着。

这段代码对于人们的疑惑常常是，我怎么知道callback要接收几个参数，参数的类型是什么？

答：是API提供者事先设计好的，它需要在文档中说明callback接收什么参数。

如代码展示的那样，API设计者通过种种技巧，实现了回调的形式，这种种技巧写起来很痛苦。而fs.readFile看起来写的很轻巧，这是因为它不光包含异步、回调，还引入的新的概念EventLoop。

EventLoop是很早前就有的概念，如MFC中的消息循环，浏览器中的事件机制等等。

那为什么要有EventLoop，它的目的是什么呢？

我们用一个简单的伪示例，看没有EventLoop时是怎么工作：

复制代码

//代码示例

function Add(a, b){

return a+b;

}

function LazyAdd(a, cb){

return function(b){

cb(a, b);

}

var result = LazyAdd(1, Add)

// 假设有一个变量button为false，我们继续调用result的条件是，当button为true的时候。

var button = false;

// 常用的办法是观察者模式，派一个人不断的看button的值，

//只要变了就开始执行result(2), 当然得有别人去改变button的值，

//这里假设有人有这个能力,比如起了另外一个线程去做。

while(true){

if(button){

result = result(2);

break;

}

result = result(2); // => 3

复制代码

所以如果有很多这样的函数，每一个都要跑一个观察者模式，在一定条件下看上去比较费计算。这时EventLoop诞生了，派一个人来轮询所有的，其他人都可以把观察条件和回调函数注册在EventLoop上，它进行统一的轮询，注册的人越多，轮询一圈的时间越长。但是简化了编程，不用每个人都写轮询了，提供API变得方便，就像fs.readFile一样简单明白，fs.readFile读取文件’/etc/passwd’，将其注册到EventLoop上，当文件读取完毕的时候，EventLoop通过轮询感知到它，并调用readFile注册时带的回调函数，这里是funtion(err, data)

换一个说法再说一遍：在特定条件下，单台机器上用空间换计算。原本callback执行了就不等了，存在一个地方，其他依赖它的，用观察着模式一直盯着它，各自轮询各自的。现在有人出来替大家统一轮询。

再换一个说法说一遍，重要的事情，换着方法说遍：在单台机器上，统一轮询看上去比较省，也带来了很多问题，比如NodeJS中单线程情况下，如果一个函数计算量非常复杂，会阻碍所有其他的事件，所以这种情况要将复杂计算交给其他线程或者是服务来做。

我们一直在强调单台机器，如果是多台，用一个统一的人来轮询，就比较恐怖了，大家把事件都注册到一台机器上，它负责轮询所有的，这个namenode就容易崩溃。所以在多台机器上，又适合，每天机器各自轮询各自的，带来的问题是状态不一致了。好的，这才是程序有意思的地方，我们需要知道为什么发明EventLoop，也需要知道EventLoop在什么地方遇到问题。那些天才的程序员，又提出了各种一致性算法来解决这个问题，本文暂不讨论。

到目前为止，我们梳理了他们之间的关系：

异步 –> 回调 –> EventLoop

每一次进步都是上一个台阶，都需要智慧来解决。

回调还产生了很多问题，最严重的问题是callback hell回调地狱。

复制代码

fs.readFile('/etc/password', function(err, data){

// do something

fs.readFile('xxxx', function(err, data){

//do something

fs.readFile('xxxxx', function(err, data){

// do something

})