Python:按键(元组)将字典拆分为更小的字典



我有一个字典,其中键是两个整数(x,y)的元组,值是字符串。

如何将此字典拆分为较小的字典,其中拆分由y-值是否大于某些trehold决定?

例如,假设我有密钥(字典值不相关,所以我在这里省略了它们(

(0, 2), (0, 4), (0, 10), (0, 3), (0, 11), (0, 20), (0, 8), (0, 14)

并说我有0, 5, 10, 15的侵入。

然后,一个部分应该由一个带有以下键的字典组成:

(0,2), (0,4), (0,3)

因为y值都大于0但不大于5。

那么下一个字典应该有键

(0,8)

因为它大于0和5但不大于10。

然后我们有(0, 10), (0, 11), (0, 14)

因为它大于(或等于(0、5、10,但不是15。

最后,我们有了(0, 20)本身。

您可以使用collections.defaultdict,迭代和更新由bucket边界确定的密钥。这是一个比创建可变数量的变量更好的想法。

d = {(0, 2): 1, (0, 4): 2, (0, 10): 3, (0, 3): 4,
(0, 11): 5, (0, 20): 6, (0, 8): 7, (0, 14): 8}
L = [0, 5, 10, 15, float('inf')]  # include infinite to facilitate later comparisons
from collections import defaultdict
dd = defaultdict(dict)
for k, v in d.items():
for i, j in zip(L, L[1:]):
if i <= k[1] < j:
dd[i].update({k: v})
break
print(dd)
defaultdict(dict,
{0: {(0, 2): 1, (0, 3): 4, (0, 4): 2},
5: {(0, 8): 7},
10: {(0, 10): 3, (0, 11): 5, (0, 14): 8},
15: {(0, 20): 6}})

该算法可以通过使用CCD_ 10来改进,而不是依次迭代CCD_ 11中的边界。

当然,这可以写得更好,但你应该明白。只需遍历dict,并根据可以动态定义或生成的各种条件检查键的y值。

thing = {
(1,2): 'a',
(2,19): 'b'
}
d1 = {}
d2 = {}
for k, v in thing.items():
// while iterating through the original dict, write some logic to determine how you want to split up based on the y values.
if k[1] < 5:
d1[k] = v
if k[1] < 10:
d2[k] = v
print(d1, d2)

这应该可以工作。

original_dict = {(0, 2):"a", (0, 4):"b", (0, 10):"c",
(0, 3):"d", (0, 11):"e", (0, 20):"f", (0, 8):"g", (0, 14):"h"}
thresholds = [0, 5, 10, 15]
thresholds = sorted(thresholds,reverse=True)
new_dict_of_dicts = {} #threshold: dict
for threshold in thresholds:
new_dict_of_dicts[threshold] = {}
for key in list(original_dict.keys()):
if key[1] > threshold:
new_dict_of_dicts[threshold][key] = original_dict.pop(key)
print(new_dict_of_dicts) 
#{15: {(0, 20): 'f'}, 10: {(0, 11): 'e', (0, 14): 'h'}, 5: {(0, 10): 'c', (0, 8): 'g'}, 0: {(0, 2): 'a', (0, 4): 'b', (0, 3): 'd'}}

这个方法对我来说似乎最简单,尽管它肯定不是最快的:

d1 = {(k1,k2):v for (k1,k2),v in d.items() if 0<k2<=5}
d2 = {(k1,k2):v for (k1,k2),v in d.items() if 5<k2<=10}
d3 = {(k1,k2):v for (k1,k2),v in d.items() if 10<k2<=15}
d4 = {(k1,k2):v for (k1,k2),v in d.items() if 15<k2}

或者像这样组合:

bounds = 0, 5, 10, 15, 1_000_000
bounds_dicts = {(b1,b2):{(k1,k2):v for (k1,k2),v in d.items() if b1<k2<=b2}
for (b1,b2) in zip(bounds[:-1],bounds[1:])}

同样,这将是低效的。对于每一本新词典,都要对词典进行一次迭代。但对于小问题,这应该没问题。

最新更新