是什么解释了通过普通类、数据类和命名元组创建对象的不同性能

我正在浏览数据类和命名元组。我发现了这种行为，使用python的不同功能创建对象具有不同的性能。

数据类：

In [1]: from dataclasses import dataclass
...:
...: @dataclass
...: class Position:
...:     lon: float = 0.0
...:     lat: float = 0.0
...:
In [2]: %timeit for _ in range(1000): Position(12.5, 345)
326 µs ± 34.9 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

正常等级：

In [1]: class Position:
...:
...:     def __init__(self, lon=0.0, lat=0.0):
...:         self.lon = lon
...:         self.lat = lat
...:
In [2]: %timeit for _ in range(1000): Position(12.5, 345)
248 µs ± 2.89 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

命名元组：

In [2]: Position = namedtuple("Position", ["lon","lat"], defaults=[0.0,0.0])
In [3]: %timeit for _ in range(1000): Position(12.5, 345)
286 µs ± 13.7 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

Python版本：3.7.3
操作系统：MacOS Mojave

所有实现都具有相同的对象属性和默认值。

为什么这种时间趋势(dataclass(>时间(namedtuple(>时间(普通班(
每种实现都需要做些什么来花费各自的时间
哪种实现在什么情况下表现最好

这里，时间表示创建对象所花费的时间。

在Python中，一切都是一个dict。在数据类的情况下，该dict中有更多的条目，因此将它们放在那里需要更多的时间。

这种变化是如何发生的@阿恩的评论发现我在这里遗漏了一些东西。我做了样本代码：

from dataclasses import dataclass
import time
@dataclass
class Position:
lon: float = 0.0
lat: float = 0.0

start_time = time.time()
for i in range(100000):
p = Position(lon=1.0, lat=1.0)
elapsed = time.time() - start_time
print(f"dataclass {elapsed}")
print(dir(p))

class Position2:
lon: float = 0.0
lat: float = 0.0
def __init__(self, lon, lat):
self.lon = lon
self.lat = lat

start_time = time.time()
for i in range(100000):
p = Position2(lon=1.0, lat=1.0)
elapsed = time.time() - start_time
print(f"just class {elapsed}")
print(dir(p))
start_time = time.time()
for i in range(100000):
p = {"lon": 1.0, "lat": 1.0}
elapsed = time.time() - start_time
print(f"dict {elapsed}")

结果：

/usr/bin/python3.8 ...../test.py
dataclass 0.16358232498168945
['__annotations__', '__class__', '__dataclass_fields__', '__dataclass_params__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'lat', 'lon']
just class 0.1495649814605713
['__annotations__', '__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'lat', 'lon']
dict 0.028212785720825195
Process finished with exit code 0

Dict示例供参考。

查看数据类，此函数：

(489) def _init_fn(fields, frozen, has_post_init, self_name, globals):

负责创建构造函数。正如Arne发现的那样，post_init代码是可选的，而不是生成的。我有另一个想法，即有一些关于领域的工作，但是：

In [5]: p = Position(lat = 1.1, lon=2.2)                                                                                                                                                                           
In [7]: p.lat.__class__                                                                                                                                                                                            
Out[7]: float

因此这里没有额外的包装/代码。从所有这些中，我看到的唯一额外的东西——就是更多的方法。

相关内容

最新更新

热门标签：