如何从共享相同键的元组列表中找到平均值?



我有两个从用户输入创建的列表,我使用以下代码将它们组合成一个元组列表:

daily_hours_list = [4, 2, 1, None, 3, 5]
week_counter_list = [1, 1, 1, 2, 2, 2]
weekly_hours_list = []
for week, time in zip(week_counter_list, daily_hours_list):
if time != None:
weekly_hours_list.append((week, t))

这给了我:

weekly_hours_list = [(1, 4),
(1, 2),
(1, 1),
(2, 3),
(2, 5)]

然后,我使用此代码对第 1 周的所有小时数和第 2 周的所有小时数求和:

tup_h = {i:0 for i, v in weekly_hours_list}
for key, value in weekly_hours_list:
tup_h[key] = tup_h[key]+value
weekly_sum_hours = list(map(tuple, tup_h.items()))

给我:

weekly_sum_hours = [(1, 6),
(2, 8)]

这一切都很好用,但是我如何找到每周的平均小时数,例如:

weekly_average_list = [(1, 2),
(2, 4)]

我想我需要扩展 for 循环计算,考虑周值为 1 和 2 的元组计数,但不确定如何实现它。提前感谢您的帮助。

我认为首先将每周的小时数收集在一起会有所帮助。这可以通过字典轻松完成,其中键是周数,值是该周的小时数列表。内置collections模块中有一个称为defaultdict的数据结构,它专为这样的场景而设计:

from collections import defaultdict
from statistics import mean
daily_hours_list = [4, 2, 1, None, 3, 5]
week_counter_list = [1, 1, 1, 2, 2, 2]
daily_hours_by_week = defaultdict(list)
for week, time in zip(week_counter_list, daily_hours_list):
if time is not None:
daily_hours_by_week[week].append(time)
sum_hours_by_week = {w: sum(hours) for w, hours in daily_hours_by_week.items()}
avg_hours_by_week = {w: mean(hours) for w, hours in daily_hours_by_week.items()}

在我们的示例中,这意味着您不必为每个周数使用空列表初始化字典(这是您对tup_h的初始0和所做的(。相反,如果我们尝试将一个小时附加到字典中尚未包含的一周,它将创建一个空列表放在该键下,然后附加到该键下。

一旦我们像这样每周组织了我们的时间,就很容易对它们进行其他处理。

我们实际上可以一次完成最后两行,并创建一个带有每周统计元组的字典:

statistics_by_week = {w: sum(hours), mean(hours) for w, hours in daily_hours_by_week.items()}

在此处阅读有关defaultdict的更多详细信息:https://docs.python.org/3/library/collections.html#collections.defaultdict

最新更新