Python中的线程:类属性(列表)不是线程安全的



我正在努力理解Python中的线程。

代码

现在我有一个问题,我把它围在一个简单的类中:

# -*- coding: utf-8 -*-
import threading
class myClassWithThread(threading.Thread):
__propertyThatShouldNotBeShared = []
__id = None
def __init__(self, id):
threading.Thread.__init__(self)
self.__id = id
def run(self):
while 1:
self.dummy1()
self.dummy2()
def dummy1(self):
if self.__id == 2:
self.__propertyThatShouldNotBeShared.append("Test value")

def dummy2(self):
for data in self.__propertyThatShouldNotBeShared:
print self.__id
print data
self.__propertyThatShouldNotBeShared.remove(data)

obj1 = myClassWithThread(1)
obj2 = myClassWithThread(2)
obj3 = myClassWithThread(3)
obj1.start()
obj2.start()
obj3.start()

描述

以下是该类的操作:该类有两个属性:

  • __id,它是对象的标识符,在调用构造函数时给定
  • __propertyThatShouldNotBeShared是一个列表,将包含一个文本值

现在的方法

  • run()包含一个无限循环,其中我调用dummy1(),然后调用dummy2()
  • dummy1(),仅当对象的__id等于2时,将值"Test value"添加到属性(列表)__propertyThatShouldNotBeShared
  • dummy2()检查列表__propertyThatShouldNotBeShared的大小是否严格高于0,则
    • 对于__propertyThatShouldNotBeShared中的每个值,它打印
    • __propertyThatShouldNotBeShared中包含的对象和值
    • 然后删除该值

这是我启动程序时得到的输出:

21
Test valueTest value
2
Test value
Exception in thread Thread-2:
Traceback (most recent call last):
File "E:PROGmyFacepythonlibthreading.py", line 808, in __bootstrap_inner
self.run()
File "E:PROGmyFacemyProjectghos2srcTeststhreadDeMerde.py", line 15, in run
self.dummy2()
File "E:PROGmyFacemyProjectghos2srcTeststhreadDeMerde.py", line 27, in dummy2
self.__propertyThatShouldNotBeShared.remove(data)
ValueError: list.remove(x): x not in list

问题

正如你在输出的第一行中看到的,我得到了这个"1"。。。这意味着,在某个时刻,id为"1"的对象试图在屏幕上打印一些东西。。。事实上确实如此!但这应该是不可能的!只有id为"2"的对象才能打印任何内容!

这个代码有什么问题?或者我的逻辑有什么问题?

问题是:

class myClassWithThread(threading.Thread):
__propertyThatShouldNotBeShared = []

它为所有共享对象定义了一个列表。你应该这样做:

class myClassWithThread(threading.Thread):
def __init__(self, id):
self.__propertyThatShouldNotBeShared = []
# the other code goes here

这里有两个问题——一个是您询问的线程安全问题,另一个没有询问的是类和实例属性之间的差异。


正是后者导致了您的实际问题。类属性由该类的所有实例共享。它与这些实例是在单个线程上访问还是在多个线程上访问无关;只有一个CCD_ 13是每个人共享的。如果你想要一个实例属性,你必须在实例上定义它,而不是在类上。像这样:

class myClassWithThread(threading.Thread):
def __init__(self, id):
self.__propertyThatShouldNotBeShared = []

一旦这样做,每个实例都有自己的__propertyHatShouldNotBeShared副本,并且每个实例都位于自己的线程上,因此不存在线程安全问题。

但是,您的原始代码确实存在线程安全问题。

几乎没有什么是自动线程安全的(又称"同步");异常(如queue.Queue)会明确地说明这一点,并且专门用于线程编程。

你可以通过三种方式来避免这种情况:

  • 不要分享任何东西
  • 不要改变你分享的任何东西
  • 除非有适当的同步对象保护,否则不要更改您共享的任何内容

最后一个当然是最灵活的,但也是最复杂的。事实上,这是人们为什么认为线程编程很难的核心。

简短的版本是,无论您在哪里修改或访问共享可变数据(如self.__propertyThatShouldNotBeShared),都需要持有某种同步对象,如Lock。例如:

class myClassWithThread(threading.Thread):
__lock = threading.Lock()
# etc.
def dummy1(self):
if self.__id == 2:
with self.__lock:
self.__propertyThatShouldNotBeShared.append("Test value")

如果您坚持使用CPython和内置类型,您通常可以忽略锁。但线程编程中的"经常"只是"总是在测试和调试期间,直到发布或大型演示,当它突然开始失败时"的同义词。除非你想学习全局解释器锁和内置类型在CPython中如何工作的规则,否则不要依赖它。

Python中的类变量只是:由类的所有实例共享。您需要一个实例变量,该变量通常在__init__中定义。删除类级声明(以及双前导下划线,它们用于名称篡改,这里不需要。)

最新更新