使用列表生成器时,Python3中的pdb模块可能存在错误



在Python 3中运行此代码后:

import pdb
def foo():
    nums = [1, 2, 3]
    a = 5
    pdb.set_trace()
foo()

以下表达式有效:

(Pdb) print(nums)
[1, 2, 3]
(Pdb) print(a)
5
(Pdb) [x for x in nums]
[1, 2, 3]

但以下表达式失败:

(Pdb) [x*a for x in nums]
*** NameError: global name 'a' is not defined

以上内容在Python 2.7中运行良好。

这是bug还是我遗漏了什么?

更新:查看新接受的答案。这确实是一个错误(或有问题的设计),现在已经通过在pdb中引入新的命令和模式来解决。

如果您在[i]pdb会话中键入interact,您将获得一个交互式会话,并且列表理解在这种模式下可以正常工作

来源:http://bugs.python.org/msg215963

它运行得非常好:

>>> import pdb
>>> def f(seq):
...     pdb.set_trace()
... 
>>> f([1,2,3])
--Return--
> <stdin>(2)f()->None
(Pdb) [x for x in seq]
[1, 2, 3]
(Pdb) [x in seq for x in seq]
[True, True, True]

如果不展示你实际在做什么,没有人能告诉你为什么在你的特定情况下你会得到NameError


TL;DR在python3中,列表理解实际上是具有自己堆栈框架的函数,并且不能从内部堆栈框架访问seq变量,它是test的参数。相反,它被视为全局(因此未找到)。


您看到的是python2和python3中列表理解的不同实现。在python 2中,列表理解实际上是for循环的一个捷径,您可以在字节码中清楚地看到这一点:

>>> def test(): [x in seq for x in seq]
... 
>>> dis.dis(test)
  1           0 BUILD_LIST               0
              3 LOAD_GLOBAL              0 (seq)
              6 GET_ITER            
        >>    7 FOR_ITER                18 (to 28)
             10 STORE_FAST               0 (x)
             13 LOAD_FAST                0 (x)
             16 LOAD_GLOBAL              0 (seq)
             19 COMPARE_OP               6 (in)
             22 LIST_APPEND              2
             25 JUMP_ABSOLUTE            7
        >>   28 POP_TOP             
             29 LOAD_CONST               0 (None)
             32 RETURN_VALUE        

注意字节码是如何包含FOR_ITER循环的。另一方面,在python3中,列表理解实际上是函数,它们有自己的堆栈框架:

>>> def test(): [x in seq2 for x in seq]
... 
>>> dis.dis(test)
  1           0 LOAD_CONST               1 (<code object <listcomp> at 0xb6fef160, file "<stdin>", line 1>) 
              3 MAKE_FUNCTION            0 
              6 LOAD_GLOBAL              0 (seq) 
              9 GET_ITER             
             10 CALL_FUNCTION            1 
             13 POP_TOP              
             14 LOAD_CONST               0 (None) 
             17 RETURN_VALUE      

正如您所看到的,这里没有FOR_ITER,取而代之的是MAKE_FUNCTIONCALL_FUNCTION字节码。如果我们检查列表理解的代码,我们就可以理解绑定是如何设置的:

>>> test.__code__.co_consts[1]
<code object <listcomp> at 0xb6fef160, file "<stdin>", line 1>
>>> test.__code__.co_consts[1].co_argcount   # it has one argument
1
>>> test.__code__.co_consts[1].co_names      # global variables
('seq2',)
>>> test.__code__.co_consts[1].co_varnames   # local variables
('.0', 'x')

这里.0是函数的唯一自变量。x是循环的局部变量,seq2全局变量。注意,列表理解参数.0是从seq获得的可迭代参数,而不是seq本身。(请参阅上面dis输出中的GET_ITER操作码)。这一点在一个更复杂的例子中更为清楚:

>>> def test():
...     [x in seq for x in zip(seq, a)]
... 
>>> dis.dis(test)
  2           0 LOAD_CONST               1 (<code object <listcomp> at 0xb7196f70, file "<stdin>", line 2>) 
              3 MAKE_FUNCTION            0 
              6 LOAD_GLOBAL              0 (zip) 
              9 LOAD_GLOBAL              1 (seq) 
             12 LOAD_GLOBAL              2 (a) 
             15 CALL_FUNCTION            2 
             18 GET_ITER             
             19 CALL_FUNCTION            1 
             22 POP_TOP              
             23 LOAD_CONST               0 (None) 
             26 RETURN_VALUE 
>>> test.__code__.co_consts[1].co_varnames
('.0', 'x')

在这里,您可以看到,列表理解的唯一自变量(总是用.0表示)是从zip(seq, a)获得的可迭代性。CCD_ 20和CCD_。只有iter(zip(seq, a))在列表理解中通过。

我们必须注意的另一点是,当您运行pdb时,您无法从要定义的函数访问当前函数的上下文。例如,以下代码在python2和python3上都失败:

>>> import pdb
>>> def test(seq): pdb.set_trace()
... 
>>> test([1,2,3])
--Return--
> <stdin>(1)test()->None
(Pdb) def test2(): print(seq)
(Pdb) test2()
*** NameError: global name 'seq' is not defined

它之所以失败,是因为在定义test2时,seq变量被视为全局变量,但它实际上是test函数内的局部变量,因此无法访问。

您看到的行为类似于以下场景:

#python 2 no error
>>> class A(object):
...     x = 1
...     L = [x for _ in range(3)]
... 
>>> 
#python3 error!
>>> class A(object):
...     x = 1
...     L = [x for _ in range(3)]
... 
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<stdin>", line 3, in A
  File "<stdin>", line 3, in <listcomp>
NameError: global name 'x' is not defined

第一个没有给出错误,因为它主要相当于:

>>> class A(object):
...     x = 1
...     L = []
...     for _ in range(3): L.append(x)
... 

由于列表理解是在字节码中"扩展"的。在python3中,它失败了,因为您实际上正在定义一个函数,并且无法从嵌套函数范围访问类范围:

>>> class A(object):
...     x = 1
...     def test():
...             print(x)
...     test()
... 
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<stdin>", line 5, in A
  File "<stdin>", line 4, in test
NameError: global name 'x' is not defined

请注意,genexp是作为函数在python2上实现的,事实上,您可以看到它们的类似行为(在python2和python3上):

>>> import pdb
>>> def test(seq): pdb.set_trace()
... 
>>> test([1,2,3])
--Return--
> <stdin>(1)test()->None
(Pdb) list(x in seq for x in seq)
*** Error in argument: '(x in seq for x in seq)'

这里pdb没有给你更多的细节,但失败发生的原因完全相同。


总之:这不是pdb中的错误,而是python实现作用域的方式。AFAIK将其更改为允许您在pdb中尝试执行的操作需要对函数的处理方式进行一些重大更改,我不知道是否可以在不修改解释器的情况下完成这一操作。


注意,当使用嵌套列表理解时,嵌套循环在字节码中进行扩展,就像python2:中的列表理解一样

>>> import dis
>>> def test(): [x + y for x in seq1 for y in seq2]
... 
>>> dis.dis(test)
  1           0 LOAD_CONST               1 (<code object <listcomp> at 0xb71bf5c0, file "<stdin>", line 1>) 
              3 MAKE_FUNCTION            0 
              6 LOAD_GLOBAL              0 (seq1) 
              9 GET_ITER             
             10 CALL_FUNCTION            1 
             13 POP_TOP              
             14 LOAD_CONST               0 (None) 
             17 RETURN_VALUE         
>>> # The only argument to the listcomp is seq1
>>> import types
>>> func = types.FunctionType(test.__code__.co_consts[1], globals())
>>> dis.dis(func)
  1           0 BUILD_LIST               0 
              3 LOAD_FAST                0 (.0) 
        >>    6 FOR_ITER                29 (to 38) 
              9 STORE_FAST               1 (x) 
             12 LOAD_GLOBAL              0 (seq2) 
             15 GET_ITER             
        >>   16 FOR_ITER                16 (to 35) 
             19 STORE_FAST               2 (y) 
             22 LOAD_FAST                1 (x) 
             25 LOAD_FAST                2 (y) 
             28 BINARY_ADD           
             29 LIST_APPEND              3 
             32 JUMP_ABSOLUTE           16 
        >>   35 JUMP_ABSOLUTE            6 
        >>   38 RETURN_VALUE        

正如您所看到的,listcomp的字节码在seq2上有一个显式的FOR_ITER。此显式FOR_ITER位于listcomp函数内部,因此对作用域的限制仍然适用(例如,seq2作为全局加载)。

事实上,我们可以使用pdb:来确认这一点

>>> import pdb
>>> def test(seq1, seq2): pdb.set_trace()
... 
>>> test([1,2,3], [4,5,6])
--Return--
> <stdin>(1)test()->None
(Pdb) [x + y for x in seq1 for y in seq2]
*** NameError: global name 'seq2' is not defined
(Pdb) [x + y for x in non_existent for y in seq2]
*** NameError: name 'non_existent' is not defined

注意NameError是关于seq2而不是seq1(作为函数参数传递)的,注意将第一个可迭代名称更改为不存在的名称是如何更改NameError的(这意味着在第一种情况下seq1成功传递)。

我只是不明白,如果你想为seq中的每个元素生成一个Trues列表,为什么你需要执行上述操作,那么为什么不[在seq中为x生成True]呢?我想,在尝试这种操作之前,你需要先分配一个本地副本。

相关内容

  • 没有找到相关文章

最新更新