nodejs 回调函数

寻技术 JS脚本 / Node.Js 2023年07月11日 85

回调,是非常基本的概念,尤其在现今NodeJS诞生与蓬勃发展中变得更加被人们重视。

很多朋友学NodeJS,学很久一直摸不着门道,觉得最后在用Express写Web程序,有这样的感觉只能说明没有学懂NodeJS,本质上说不理解回调,就不理解NodeJS。

 

NodeJS有三大核心: 

- CallBack回调 

- Event事件 

- Stream流

 

先来看什么不叫回调,下面是很多网友误认为的回调:

 

复制代码

//代码示例

//Foo函数意在接收两个参数,任意类型a,和函数类型cb,在结尾要调用cb()

function Foo(a, cb){

    console.log(a);

    // do something else

    // Maybe get some parameters for cb

    var param = Math.random();

    cb(param);

}

//定义一个叫CallBack的函数,将作为参数传给Foo

var CallBack = function(num){

    console.log(num);

}

//调用Foo

Foo(2, CallBack);

复制代码

以上代码不是回调,以下指出这里哪些概念容易混淆: 

- 变量CallBack,被赋值为一个匿名函数,但是不因为它名字叫CallBack,就称知为回调 

_ Foo函数的第二个形式参数名为cb,同理叫cb,和是不是回调没关系 

_ cb在Foo函数代码最后被以cb(param)的形式调用,不因为cb在另一个函数中被调用,而将其称之为回调

 

直白来讲,以上代码就是普通的函数调用,唯一特殊一点的地方是,因为JS有函数式语言的特性,可以接收函数作为参数。在C语言里可以用指向函数的指针来达到类似效果。

 

讲到这里先停一下,大家注意到本文的标题是解读异步、回调和EventLoop,回调之前还有异步呢,这个顺序对于理解很有帮助,可以说理解回调的前提,是理解异步。

 

说到异步,什么是异步呢?和分布、并行有什么区别?

 

回归原始,追根溯源是我们学习编程的好方法,不去想有什么高级的工具和概念,而去想如果我们只有一个浏览器做编译器和一个记事本,用plain JS写一段异步代码,怎么写?不能用事件系统,不能用浏览器特性。

 

小明:刚才上面那段代码是异步的吗? 

老袁:当然不是,即便把Foo改为AsyncFoo也不是。这里比较迷惑的是cb(param)是在Foo函数的最后被调用的。 

小明:好像觉得异步的代码,确实应该在最后调一个callback函数,因为之后的代码不会被执行到了。 

老袁:异步的一个定义是函数调用不返回原来代码调用处,而cb(params)调用完后,依旧返回到Foo的尾部,即便cb(params)后还有代码,它们也可以被执行到,这是个同步调用。

 

Plain JS 异步的写法有很多,以经典的为例:

 

复制代码

//代码示例

// ====同步的加法

function Add(a, b){

    return a+b;

}

Add(1, 2) // => 3

 

// ====异步的加法

function LazyAdd(a){

    return function(b){

        return a+b;

    }

}

var result = LazyAdd(1); // result等于一个匿名函数,实际是闭包

//我们的目的是做一个加法,result中保存了加法的一部分,即第一个参数和之后的运算规则,

//通过返回一个持有外层参数a的匿名函数构成的闭包保存至变量result中,这部是异步的关键。

//极端的情况var result = LazyAdd(1)(2);这种极端情况又不属于异步了,它和同步没有区别。

 

// 现在可以写一些别的代码了

    console.log('wait some time, doing some fun');

// 实际生产中不会这么简单,它可能在等待一些条件成立,再去执行另外一半。

 

result = result(2) // => 3

复制代码

 

 

上述代码展示了,最简单的异步。我们要强调的事,异步是异步,回调是回调,他俩半毛钱关系都没有。

 

Ok,下面把代码改一改,看什么叫回调:

 

复制代码

//代码示例

//注意还是那个Add,精髓也在这里,随后说到

function Add(a, b){

    return a+b;

}

//LazyAdd改变了,多了一个参数cb

function LazyAdd(a, cb){

    return function(b){

        cb(a, b);

    }

}

//将Add传给形参cb

var result = LazyAdd(1, Add)

// doing something else

result = result(2); // => 3

复制代码

这段代码,看似简单,实则并不平凡。

 

小明:这代码给人的第一感觉就是脱裤子放屁,明明一个a+b,先是变成异步的写法就多了很多代码,人都看不懂了,现在的这个加了所谓的“回调”,更啰嗦了,最后得到的结果都是1+2=3,尼玛这不有病吗? 

老袁:你只看到了结果,却不知道为什么人家这么写,这样写为了什么。代码示例和中,同样的Add函数,作为参数传到LazyAdd中,此时它是回调。那为什么代码示例中,Foo中传入的cb不是回调呢?要仔细体会这句话,需要带状态的才叫回调函数,own state,这里通过闭包保存的a就是状态。 

小明:我伙呆 

老袁:现在再说为什么要有回调,单看输出结果,回调除了啰嗦和难于理解之外没有任何意义。但是!!!

 

现在说吧,CallBack的好处是:保证API不撕裂 

也就是说,异步是很有需求的,处理的好能使计算效率提高,不至于卡在某处一直等待。但是异步的写法,我们看到了非常难看,把一个加法变成异步,都如此难看,何况其他。那么CallBack的妙处就是“保证API不撕裂”,代码中写到的精髓所在,还是那个Add,对,让程序员在写异步程序的时候,还能够像同步写法那样好理解,Add作为CallBack传入,保证的是Add这个方法好理解,作为API设计中的重要一个环节,保证开发者用起来方便,代码可读性高。

 

以NodeJS的readFile API为例进一步说明: 

fs.readFile(filename, [options], callback) 

有两个必填的参数filename和callback 

callback是实际程序员要写代码的地方,写它的时候假设文件已经读取到了,该怎么写还怎么写,是API历史上的一次大进步。

 

//读取文件'etc/passwd',读取完成后将返回值,传入function(err, data) 这个回调函数。

fs.readFile('/etc/passwd', function (err, data) {

  if (err) throw err;

  console.log(data);

});

回调和闭包有一个共同的特性:在最终“回调 ”调用以前,前面所有的状态都得存着。

 

这段代码对于人们的疑惑常常是,我怎么知道callback要接收几个参数,参数的类型是什么? 

答:是API提供者事先设计好的,它需要在文档中说明callback接收什么参数。

 

如代码展示的那样,API设计者通过种种技巧,实现了回调的形式,这种种技巧写起来很痛苦。而fs.readFile看起来写的很轻巧,这是因为它不光包含异步、回调,还引入的新的概念EventLoop。

 

EventLoop是很早前就有的概念,如MFC中的消息循环,浏览器中的事件机制等等。

 

那为什么要有EventLoop,它的目的是什么呢?

 

我们用一个简单的伪示例,看没有EventLoop时是怎么工作:

 

复制代码

//代码示例

function Add(a, b){

    return a+b;

}

 

function LazyAdd(a, cb){

    return function(b){

        cb(a, b);

    }

}

 

var result = LazyAdd(1, Add)

// 假设有一个变量button为false,我们继续调用result的条件是,当button为true的时候。

var button = false;

 

// 常用的办法是观察者模式,派一个人不断的看button的值,

//只要变了就开始执行result(2), 当然得有别人去改变button的值,

//这里假设有人有这个能力,比如起了另外一个线程去做。

while(true){

    if(button){

        result = result(2);

        break;

    }

}

 

result = result(2); // => 3

复制代码

所以如果有很多这样的函数,每一个都要跑一个观察者模式,在一定条件下看上去比较费计算。这时EventLoop诞生了,派一个人来轮询所有的,其他人都可以把观察条件和回调函数注册在EventLoop上,它进行统一的轮询,注册的人越多,轮询一圈的时间越长。但是简化了编程,不用每个人都写轮询了,提供API变得方便,就像fs.readFile一样简单明白,fs.readFile读取文件’/etc/passwd’,将其注册到EventLoop上,当文件读取完毕的时候,EventLoop通过轮询感知到它,并调用readFile注册时带的回调函数,这里是funtion(err, data)

 

换一个说法再说一遍:在特定条件下,单台机器上用空间换计算。原本callback执行了就不等了,存在一个地方,其他依赖它的,用观察着模式一直盯着它,各自轮询各自的。现在有人出来替大家统一轮询。

 

再换一个说法说一遍,重要的事情,换着方法说遍:在单台机器上,统一轮询看上去比较省,也带来了很多问题,比如NodeJS中单线程情况下,如果一个函数计算量非常复杂,会阻碍所有其他的事件,所以这种情况要将复杂计算交给其他线程或者是服务来做。 

我们一直在强调单台机器,如果是多台,用一个统一的人来轮询,就比较恐怖了,大家把事件都注册到一台机器上,它负责轮询所有的,这个namenode就容易崩溃。所以在多台机器上,又适合,每天机器各自轮询各自的,带来的问题是状态不一致了。好的,这才是程序有意思的地方,我们需要知道为什么发明EventLoop,也需要知道EventLoop在什么地方遇到问题。那些天才的程序员,又提出了各种一致性算法来解决这个问题,本文暂不讨论。

 

到目前为止,我们梳理了他们之间的关系: 

异步 –> 回调 –> EventLoop 

每一次进步都是上一个台阶,都需要智慧来解决。

 

回调还产生了很多问题,最严重的问题是callback hell回调地狱。

 

复制代码

fs.readFile('/etc/password', function(err, data){

    // do something

    fs.readFile('xxxx', function(err, data){

        //do something

            fs.readFile('xxxxx', function(err, data){

            // do something

        })

    })

})

复制代码

这个例子可能不恰当,但也能理解,在类似这种情况会出现一层套一层的代码,可读性、维护性差。

 

在ES6 里面给出了Generator,来解决异步编程的问题。

关闭

用微信“扫一扫”