好吧,请耐心等待,我知道它看起来会令人费解,但请帮助我了解发生了什么。

from functools import partial

class Cage(object):
    def __init__(self, animal):
        self.animal = animal

def gotimes(do_the_petting):
    do_the_petting()

def get_petters():
    for animal in ['cow', 'dog', 'cat']:
        cage = Cage(animal)

        def pet_function():
            print "Mary pets the " + cage.animal + "."

        yield (animal, partial(gotimes, pet_function))

funs = list(get_petters())

for name, f in funs:
    print name + ":", 
    f()


给与:

cow: Mary pets the cat.
dog: Mary pets the cat.
cat: Mary pets the cat.


那么,基本上,为什么我没有得到三种不同的动物? cage是否“打包”到嵌套函数的本地范围中?如果没有,对嵌套函数的调用如何查找局部变量?

我知道遇到此类问题通常意味着一个人“做错了”,但我想了解会发生什么。

评论

尝试用['cat','dog','cow']来做动物...我敢肯定有人会来解释这个-它是那些Python陷阱之一:)

#1 楼

嵌套函数在执行时(而不是在定义时)从父范围中查找变量。

编译函数主体,并验证“自由”变量(未在函数本身中通过赋值定义) ,然后将其作为闭合单元绑定到该函数,并且代码使用索引来引用每个单元。因此,pet_function有一个自由变量(cage),然后通过闭包单元索引0对其进行引用。闭包本身指向cage函数中的局部变量get_petters

当您实际调用该函数时,然后,在调用该函数时,使用该闭包查看周围范围内的cage的值。问题就在这里。在您调用函数时,get_petters函数已经完成了对其结果的计算。在执行过程中的某个时刻,为cage局部变量分配了'cow''dog''cat'字符串中的每个字符串,但是在函数结尾处,cage包含最后一个值'cat'。因此,当调用每个动态返回的函数时,将获得打印的值'cat'。解决方法是不依赖闭包。您可以改用部分函数,​​创建新函数作用域或将变量绑定为关键字参数的默认值。



部分函数示例,使用functools.partial()

from functools import partial

def pet_function(cage=None):
    print "Mary pets the " + cage.animal + "."

yield (animal, partial(gotimes, partial(pet_function, cage=cage)))



创建新的范围示例:

def scoped_cage(cage=None):
    def pet_function():
        print "Mary pets the " + cage.animal + "."
    return pet_function

yield (animal, partial(gotimes, scoped_cage(cage)))



绑定变量作为关键字参数的默认值:

def pet_function(cage=cage):
    print "Mary pets the " + cage.animal + "."

yield (animal, partial(gotimes, pet_function))



无需在循环中定义scoped_cage函数,编译仅进行一次,不在循环的每次迭代中。

评论


今天我在工作脚本上用力撞墙三个小时。您的最后一点很重要,这也是我遇到此问题的主要原因。我在整个代码中都使用了带有闭包的回调函数,但是在循环中尝试相同的技术才使我受益。

–Esperanto博士
18-3-7的4:11

#2 楼

我的理解是,实际上在调用产生的pet_function时而不是在之前,在父函数名称空间中查找了笼子。

所以当您执行

funs = list(get_petters())


您将生成3个函数,这些函数将找到最后创建的笼子。

如果将最后一个循环替换为:

for name, f in get_petters():
    print name + ":", 
    f()


您将实际得到的是:

cow: Mary pets the cow.
dog: Mary pets the dog.
cat: Mary pets the cat.


#3 楼

这源于以下内容

for i in range(2): 
    pass

print(i)  # prints 1


迭代i的值作为其最终值后被存储。

作为生成器,函数将可以工作(即依次打印每个值),但是当转换为列表时,它将在生成器上运行,因此对cagecage.animal)的所有调用都返回cats。

#4 楼

让我们简化问题。定义:
def get_petters():
    for animal in ['cow', 'dog', 'cat']:
        def pet_function():
            return "Mary pets the " + animal + "."

        yield (animal, pet_function)

然后,就像在问题中一样,我们得到:
>>> for name, f in list(get_petters()):
...     print(name + ":", f())

cow: Mary pets the cat.
dog: Mary pets the cat.
cat: Mary pets the cat.

但是如果我们避免先创建list()
>>> for name, f in get_petters():
...     print(name + ":", f())

cow: Mary pets the cow.
dog: Mary pets the dog.
cat: Mary pets the cat.

是什么继续吗为什么这种微妙的差异会完全改变我们的结果?

如果我们看一下list(get_petters()),从不断变化的内存地址中可以明显看出,我们确实产生了三种不同的功能:
>>> list(get_petters())

[('cow', <function get_petters.<locals>.pet_function at 0x7ff2b988d790>),
 ('dog', <function get_petters.<locals>.pet_function at 0x7ff2c18f51f0>),
 ('cat', <function get_petters.<locals>.pet_function at 0x7ff2c14a9f70>)]

但是,请查看这些函数绑定到的cell:对于两个循环,cell对象在整个迭代过程中保持不变。但是,正如预期的那样,它引用的特定str在第二个循环中有所不同。 cell对象引用animal,该对象是在调用get_petters()时创建的。但是,animal会在生成器函数运行时更改其所引用的str对象。
在第一个循环中,在每次迭代期间,我们都会创建所有f,但是只有在生成器get_petters()完全耗尽并且list函数已经创建。
在第二个循环中,在每次迭代期间,我们都暂停get_petters()生成器,并在每次暂停后调用f。因此,我们最终在生成器功能暂停的那一刻检索animal的值。
@Claudiu回答了一个类似的问题:

三个独立的函数是创建的,但是它们每个都有其定义环境的关闭-在这种情况下,是全局环境(如果将循环放置在另一个函数内部,则为外部函数的环境)。不过,这确实是问题所在-在这种环境下,animal发生了突变,并且所有闭包都引用相同的animal
[编辑注释:i已更改为animal。]