在Python中搜索四元组



我有一组四元组('myTup')和一个元组('tupleToSearch')。我需要在每个四元组中搜索这个元组的所有实例。'tupleToSearch'将与每个四元组的前两个元素进行比较,如果匹配,则报告匹配的四元组的最后两个元素。

我使用下面的代码做同样的事情。

myTup = set([('0994900', '50.2297', 'name1', '<4'),
             ('2176041', '24.2880', 'name2', 'POSITIVE'), 
             ('2240663', '51.2510', 'name3', '25.0'), 
             ('2240663', '51.2510', 'name4', '29.0'), 
             ('2240663', '51.2560', 'name4', '29.0')])
tupToSearch = ('2240663', '51.2510')

[(x[2],x[3]) for x in myTup if tupToSearch == (x[0],x[1])]

我需要扩展这段代码,使其不是精确搜索,而是对range执行比较。

例如,给定tupleToSearch = ('2240663', '51.2510'),我想找到第二个元素>= 51.2510但小于(51.2510 + offset)的四元组。这里'offset'是一个常量。

上例中的正确答案将报告最后三个四元组(每个四元组中只有最后两个元素)。

如何将第二个元素转换为数值以进行正确的比较。

同样,我需要一种有效的方法来做到这一点,因为我需要重复这个步骤近十亿次

过滤出您想要的元素,然后取出每个元素的块来创建您的结果。

[(el[2], float(el[3])) for el in itertools.ifilter(lambda oel: oel[0] == search_tup[0] and float(search_tup[1]) <= float(oel[1]) <= float(search_tup[1]) + offset, my_tup)]

或者,使用生成器一次性完成整个过程(注意,生成器与列表比较不同,它将优雅地处理el[3]不能转换为浮点数的情况)。

def filtered_data(input, search_target, offset):
    key = search_target[0]
    value = float(search_target[1])
    for entry in input:
        entry_value = float(entry[1])
        if entry[0] == key and entry_value <= value <= entry_value + offset:
            try:
                result_value = float(entry[3])
            except ValueError:
                result_value = entry[3]
            yield (entry[2], result_value)
[filtered_data(my_tup, search_tup, .019)]

请注意,由于这里使用的是浮点值,因此您的过滤过程将始终受到浮点十进制值转换为浮点二进制值时引入的无误不准确性的影响。因此,您可能希望使用Decimal或在基值上建立偏移量。

这里有一个float函数,可以用来写下面的代码:

low_target = float(tupToSearch[1])
high_target = low_target + constant
[(x[2],x[3]) for x in myTup if low_target<=float(x[1])<=high_target]

最新更新