延迟绑定是什么?
Python中的延迟绑定是指在嵌套函数中,内部函数在被调用时才会绑定外部函数的变量,而不是在定义内部函数时就绑定。这种绑定方式可以导致一些出乎意料的行为,因为变量的值是在函数调用时决定的,而不是在函数定义时。
具体来说,当一个嵌套函数引用了外部函数的变量时,Python会在内部函数被调用时搜索变量的值,而不是在内部函数定义时。这意味着如果外部函数的变量在内部函数被调用之前被改变了,内部函数将使用新的变量值,而不是定义时的值。这种行为可能会导致一些困惑和错误,特别是在使用嵌套函数进行编程时。
举个栗子
下面是一个例子,展示了延迟绑定的行为:
def outer(): numbers = [1, 2, 3, 4, 5] funcs = [] for number in numbers: def inner(): return number funcs.append(inner) return funcs for func in outer(): print(func())
输出结果为:
5
5
5
5
5
这是因为每个内部函数都引用了外部函数的 number
变量,但是这个变量在内部函数被调用时才会被绑定。由于 number
在每个迭代中的值都被重新赋值,所有内部函数都返回最后一个值,即 5。
为了避免延迟绑定可能导致的问题,可以通过将变量的值作为参数传递给内部函数来显式地绑定变量。例如,上面的代码可以修改如下:
def outer(): numbers = [1, 2, 3, 4, 5] funcs = [] for number in numbers: def inner(number=number): return number funcs.append(inner) return funcs for func in outer(): print(func())
输出结果为:
1
2
3
4
5
在这个版本中,每个内部函数都有一个默认参数 number
,它的默认值是外部循环的 number
变量。由于默认参数的值在内部函数被定义时就被确定了,所以每个内部函数都绑定了不同的变量值。
另一个典型的栗子
def multipliers(): return [lambda x : i*x for i in range(4)] print([m(2) for m in multipliers()])
输出结果为:
[6, 6, 6, 6]
是不是和你的想不一样呢!!为什么呢??
这是因为,在multipliers
函数中,返回的是一个包含四个 lambda 函数的列表,这些 lambda 函数的形式参数为 x
,函数体为 i*x
。当这些 lambda 函数被调用时,它们的 i
取决于它们在列表中的索引,而不是在定义时的值。因此,当我们在 [m(2) for m in multipliers()]
中迭代这些 lambda 函数并传递 2
作为参数时,所有 lambda 函数的 i
都是最后一个 i
的值,即 3
,因此所有的 lambda 函数都会返回 3*2=6
。
还不是很清楚?
没关系,让我们换一种方式解释下。
将 lambda 函数转换为等价的普通函数,可以更清晰地看到问题出在哪里。 首先,我们将原始的 lambda 函数:
lambda x : i*x
转换为等价的普通函数:
def multiplier(x): return i*x
然后,我们将 multipliers()
函数中的 lambda 函数列表转换为等价的普通函数列表:
def multipliers(): funcs = [] for i in range(4): def multiplier(x): return i*x funcs.append(multiplier) return funcs
现在,我们可以更清晰地看到问题出在哪里。在原始的 lambda 函数中,i
是一个自由变量,它的值在函数调用时动态绑定。但是,在 multipliers()
函数中,每个 multiplier()
函数都使用了同一个自由变量 i
,其值在函数迭代结束后被设置为 3
。因此,当我们迭代这些函数并传递 2
作为参数时,每个函数都会乘以最后一个 i
的值,也就是 3
,所以结果会是 [6, 6, 6, 6]
。
如果要解决这个问题,可以使用闭包来捕获每个 lambda 函数所需的 i
值,使每个函数都有自己独立的 i
值。这样,当我们迭代这些函数并传递参数 2
时,每个函数都会乘以它们自己独立的 i
值,而不是最后一个 i
的值。
怎么避免这个问题呢
要避免这个问题,我们可以将 lambda 函数中的 i
变为默认参数,这样每个 lambda 函数都会有一个独立的 i
值。下面是一个修改后的代码:
def multipliers(): return [lambda x, i=i : i*x for i in range(4)] print([m(2) for m in multipliers()])
输出结果为:
[0, 2, 4, 6]
现在,每个 lambda 函数都有一个独立的 i
值,因此输出结果正确。
将 lambda 函数转换为等价的普通函数,可以更清晰地看到问题出在哪里。
def multipliers(): funcs = [] for i in range(4): def multiplier(x, i=i): return i*x funcs.append(multiplier) return funcs
这里我们使用了闭包来捕获每个 lambda 函数所需的 i
值,这样每个函数都有一个独立的 i
值。
现在,我们可以更清晰地看到问题出在哪里。在原始的 lambda 函数中,i
是一个自由变量,它的值在函数调用时动态绑定。但是,在 multipliers()
函数中,每个 multiplier()
函数都有自己独立的 i
值,这个值是在函数定义时静态绑定的。因此,当我们迭代这些函数并传递 2
作为参数时,所有函数的 i
值都是它们在定义时的值,而不是在调用时动态绑定的值。
通过使用闭包来捕获每个 lambda 函数所需的 i
值,我们可以解决这个问题,使每个函数都有自己独立的 i
值。