Django ORM:根据相关模型中的时间顺序字段过滤主模型



让我们假设我们有以下模型:

class Patient(models.Model)
    name = models.CharField()
    # other fields following
class MedicalFile(model.Model)
    patient = models.ForeignKey(Patient, related_name='files')
    date = models.DateField()
    diagnostic = models.CharField()

我们想为患者构建一个视图集,我们想根据他们最近可用/有效的诊断来过滤患者记录。

如果不使用原始sql,我不知道如何解决这个问题。是否有一个最佳的方法来构建这个语句只使用Django查询集语法?


我知道这不是很好,但它是过滤大型数据集的最佳选择。

我们的想法是使用在数据库层实现的视图,我们将在其中查询所有患者及其相关的最新医疗文件,而不是将Django实体映射到该视图。当然,我们会将新模型设置为非托管模式。

为什么要走这么长的路?因为在新的模型中,我们可以使用"可重用"的Django查询语法。当然,来自数据库的视图是不可重用的,必须为每个数据库后端解决方案重新创建。

考虑到Postgres,这将是视图定义:

SELECT
    p.*,
    f.*
FROM Person p
    LEFT JOIN (
        SELECT
            *,
            max(date) OVER (PARTITION BY person_id) AS latest_date
        FROM MedicalFile
    ) AS mf ON mf.person_id = p.person_id
WHERE
    mf.latest_date IS NULL OR mf.latest_date = mf.date

然后我们可以像这样创建相关的模型

class LatestMedicalFile(models.Model):
    patient = models.OneToOneField(Patient, related_name="latest_file")
    date = models.DateField()
    diagnostic = models.CharField()
    class Meta:
        managed = False
        db_table = '<your view name here>'

最后,我们的查询可以这样写:

Patient.objects.filter(latest_file__diagnostic='flu')

在我看来,这既不直观,也不干净。有什么想法吗?

如果您有兴趣查看这些文件:

MedicalFile.objects.annotate(
    maxdate=Max(
        'patient__files__date'
        )).filter(
            maxdate=F('date'),
            diagnosis="flu").select_related(
                'patient'
            )

如果你想要病人:

Patient.objects.annotate(
    maxdate=Max(
        'files__date'
        )).filter(
            maxdate=F('files__date'),
            files__diagnosis="flu"))

非常感谢Roba,协作问答是我最喜欢的SO用户类型。

最新更新