我正在努力理解Python中的线程。
代码
现在我有一个问题,我把它围在一个简单的类中:
# -*- coding: utf-8 -*-
import threading
class myClassWithThread(threading.Thread):
__propertyThatShouldNotBeShared = []
__id = None
def __init__(self, id):
threading.Thread.__init__(self)
self.__id = id
def run(self):
while 1:
self.dummy1()
self.dummy2()
def dummy1(self):
if self.__id == 2:
self.__propertyThatShouldNotBeShared.append("Test value")
def dummy2(self):
for data in self.__propertyThatShouldNotBeShared:
print self.__id
print data
self.__propertyThatShouldNotBeShared.remove(data)
obj1 = myClassWithThread(1)
obj2 = myClassWithThread(2)
obj3 = myClassWithThread(3)
obj1.start()
obj2.start()
obj3.start()
描述
以下是该类的操作:该类有两个属性:
__id
,它是对象的标识符,在调用构造函数时给定__propertyThatShouldNotBeShared
是一个列表,将包含一个文本值
现在的方法
run()
包含一个无限循环,其中我调用dummy1()
,然后调用dummy2()
dummy1()
,仅当对象的__id
等于2时,将值"Test value"添加到属性(列表)__propertyThatShouldNotBeShared
dummy2()
检查列表__propertyThatShouldNotBeShared
的大小是否严格高于0,则- 对于
__propertyThatShouldNotBeShared
中的每个值,它打印 __propertyThatShouldNotBeShared
中包含的对象和值- 然后删除该值
- 对于
这是我启动程序时得到的输出:
21
Test valueTest value
2
Test value
Exception in thread Thread-2:
Traceback (most recent call last):
File "E:PROGmyFacepythonlibthreading.py", line 808, in __bootstrap_inner
self.run()
File "E:PROGmyFacemyProjectghos2srcTeststhreadDeMerde.py", line 15, in run
self.dummy2()
File "E:PROGmyFacemyProjectghos2srcTeststhreadDeMerde.py", line 27, in dummy2
self.__propertyThatShouldNotBeShared.remove(data)
ValueError: list.remove(x): x not in list
问题
正如你在输出的第一行中看到的,我得到了这个"1"。。。这意味着,在某个时刻,id为"1"的对象试图在屏幕上打印一些东西。。。事实上确实如此!但这应该是不可能的!只有id为"2"的对象才能打印任何内容!
这个代码有什么问题?或者我的逻辑有什么问题?
问题是:
class myClassWithThread(threading.Thread):
__propertyThatShouldNotBeShared = []
它为所有共享对象定义了一个列表。你应该这样做:
class myClassWithThread(threading.Thread):
def __init__(self, id):
self.__propertyThatShouldNotBeShared = []
# the other code goes here
这里有两个问题——一个是您询问的线程安全问题,另一个没有询问的是类和实例属性之间的差异。
正是后者导致了您的实际问题。类属性由该类的所有实例共享。它与这些实例是在单个线程上访问还是在多个线程上访问无关;只有一个CCD_ 13是每个人共享的。如果你想要一个实例属性,你必须在实例上定义它,而不是在类上。像这样:
class myClassWithThread(threading.Thread):
def __init__(self, id):
self.__propertyThatShouldNotBeShared = []
一旦这样做,每个实例都有自己的__propertyHatShouldNotBeShared副本,并且每个实例都位于自己的线程上,因此不存在线程安全问题。
但是,您的原始代码确实存在线程安全问题。
几乎没有什么是自动线程安全的(又称"同步");异常(如queue.Queue
)会明确地说明这一点,并且专门用于线程编程。
你可以通过三种方式来避免这种情况:
- 不要分享任何东西
- 不要改变你分享的任何东西
- 除非有适当的同步对象保护,否则不要更改您共享的任何内容
最后一个当然是最灵活的,但也是最复杂的。事实上,这是人们为什么认为线程编程很难的核心。
简短的版本是,无论您在哪里修改或访问共享可变数据(如self.__propertyThatShouldNotBeShared
),都需要持有某种同步对象,如Lock
。例如:
class myClassWithThread(threading.Thread):
__lock = threading.Lock()
# etc.
def dummy1(self):
if self.__id == 2:
with self.__lock:
self.__propertyThatShouldNotBeShared.append("Test value")
如果您坚持使用CPython和内置类型,您通常可以忽略锁。但线程编程中的"经常"只是"总是在测试和调试期间,直到发布或大型演示,当它突然开始失败时"的同义词。除非你想学习全局解释器锁和内置类型在CPython中如何工作的规则,否则不要依赖它。
__init__
中定义。删除类级声明(以及双前导下划线,它们用于名称篡改,这里不需要。)