从子列表中提取具有最大项的元组(在目录中查找最近的报表)

我有一个脚本，它在一系列特定的子目录中创建所有pdf的目录列表。输出是元组，其中包括保存为字符串的文件的年份，以及生成报告的单元的id，该报告看起来如下：

unit1, 2010
unit2, 2002
unit2, 2005
unit2, 2010 
unit3, 2003

我现在要做的是创建一个报告，根据第二个项中包含最大值的元组查找最新的报告。通常，我会在Access中使用MAX查询来完成这一操作，但是，从那以后，我正试图取消这一步骤，并同时编写摘录。使用我的原始代码，我的输出将包括以下内容：

unit1, '2010'
unit2, '2010'
unit3, '2003'

我环顾四周，意识到我需要更改脚本，以便它生成一个与每个唯一id匹配的元组列表。使用我从"将元组列表拆分为同一元组字段的子列表"中找到的好答案，我能够将结果拆分为一组子列表。这意味着我的输出现在如下：

[[(unit1, '2010')],[(unit12, '2010'), (unit2, '2010'), (unit2, '2005'), (unit2, '2002')],[(unit3, '2003']]

我现在的困难是尝试从包含最高值项的每个子列表中提取元组。我尝试了以下方法：

import glob, os, itertools, operator  
dirtup = []
for f in glob.glob('P:Office*Technical*Bureau*T**YR2*R***.pdf'):
    fpath, fname = os.path.split(f)
    fyr = fpath[91:95]
    vcs = 'Volume'
    rname, extname = os.path.splitext(fname)
    rcid = fname[0:7]
    dirtup.append ((f, fyr, rcid, vcs))
dirtup2 = sorted(dirtup, key=operator.itemgetter(2))
for key, group in itertools.groupby(dirtup2, operator.itemgetter(2)):
    maxval = max(x[1] for x in dirtup2)
print [x for x in dirtup2 if x[1] == maxval]

这只返回与每个子列表的最大fyr匹配的元组，而不是与最大fyr相匹配的元组。

编辑

使用mglison的第一个答案，我能够获得输出（包含第二个最大值项的元组）。

您可以根据特定字段对每个子列表进行排序，并获取排序后的子列表的第一个元素。

for key,group in itertools.groupby(dirtup2,operator.itemgetter(2)):
    newlist=sorted(group,key=operator.itemgetter(1),reverse=True)
    tuple_with_max=newlist[0]
    print tuple_with_max

相关内容

最新更新

热门标签：