我要做的是编写一个查询集,过滤出唯一的父/名组合。我只对第一次出现唯一父名感兴趣。
ID PARENT TYPE LIBTYPE NAME
1 1 project 1 book_a
4 4 project 2 book_b
5 4 project 2 book_c
6 4 project 2 book_d
7 4 project 4 book_c
8 5 project 2 book_e
9 5 project 4 book_e
10 7 project 0 book_f
11 7 project 0 book_g
12 7 project 6 book_h
13 6 user 1 book_i
14 6 project 1 book_j
15 6 project 1 book_k
16 7 project 5 book_h
17 7 project 8 book_h
18 7 project 7 book_h
19 7 project 9 book_h
20 7 project 1 book_h
21 8 project 1 book_a
我们从一个基本的查询集开始。
vars = Variants.objects.filter(type="project")
这删除了唯一的用户。在纯python中,我会这样做来过滤掉这个吸盘。
vars = Variants.objects.filter(type="project")
new_vars = []
for idx, var in vars.enumerate():
if var.name not in new_vars:
new_vars.append((var.parent,var.name))
else:
del vars[idx]
最后,我应该以以下ID结束(1,4,5,6,8,10,11,13,14,15,21)显然,我不能在Queryset上枚举,而且我确信在Django中有一种过滤方法。
有人能告诉我如何在Django中有效地做到这一点吗?
恐怕你所谓的"纯Python"解决方案毫无意义。首先,enumerate
是内置的,所以可以调用enumerate(vars)
;其次,你给new_vars添加一个元组,这样var in new_vars
就永远不会为True;第三,我看不出你想用del
语句做什么——你永远不应该修改你正在迭代的东西。
在Python中一个更好的解决方案可能是这样的:
var_dict = {}
for var in vars:
if var.name not in var_dict:
var_dict[var.name] = var
return var_dict.values()
与查询集同样有效。
如果我理解正确的话,你是在寻找db级的解决方案。这是不可能的,因为聚合函数作用于所选的整行。您可以获得(parent, name)
的唯一值,但您无法获得ID -因为(id, parent, name)
不是唯一组合。
我是这样做的——Dan是对的,我是个笨蛋。
projects = Variant.objects.filter(type="project")
filter_list, uniq_projs = [], []
for project in projects:
if (project.name, project.parent) not in uniq_projs:
uniq_projs.append((project.name, project.parent))
filter_list.append(project.id)
projects = Variant.objects.filter(type="project", id__in=filter_list).order_by('parent__name')
感觉好傻…