按月计数,只有两个日期字段 - IN 和 OUT


找到这个特定问题的答案。 需要按月对不同产品进行分组的库存总数。 源数据具有日期字段,一个用于 IN,一个用于 OUT。 特定月份的总数将包括 IN 日期早于特定月份的所有行的聚合总和,只要退出日期为 null 或日期晚于特定月份。

显然,我可以通过编写一个查询 count(不同的产品 ID)来获取任何给定月份的计数,并带有一个 WHERE 子句,说明 IN 日期在我感兴趣的月份之前(IE 2012 年 9 月),并且退出日期为 null 或在 9/2012 之后:

Where ((in_date <= '2012-09-30') AND (out_date >= '2012-09-01' or out_date is null))  

如果该产品甚至是 9 月一天库存的一部分,我希望它能够计算在内,这就是为什么超过 9 年 1 月 12 日的原因。 示例数据如下。 而不是查询特定月份,我该如何打开它:

原始数据 - 每一行都是单独的项目

InDate OutDate ProductAttr ProductID2008-04-05 空蓝 1012008-06-04 空红 1252008年01月01日 2012年06月01日 蓝色 1342008年12月10日 2012年10月09日 红色 1292009年10月15日 2012年11月01日 蓝色 1532012年10月01日 2013年06月01日 红色 149


日期产品吸引计数2008年04月 蓝色 5032008-04 红色 10022008-05 蓝色 942008年05月 红色 30042008-06 蓝色 20002008-06 红色 322


过期值计数2008年05月 2012年05月 蓝色 1192008年05月 2008年06月 红色 3332008-05 2012-10 蓝色 42008-05 空红 174882008年06月 2012年11月 蓝色 7112008-06 2013-02 红 34

如果您想知道截至 2012 年 10 月有多少产品是"IN",您将对除 2 行之外的所有行的计数求和。 按值分组以保持蓝色和红色分开。 排除第 2 行,因为 OutDate 在 2012 年 10 月之前。



戈登·林诺夫的解决方案就像我需要的那样工作。 我现在遇到的唯一问题是查询的大小和效率,因为我上面省略的部分是产品属性实际上位于不同的表中,然后是 IN/OUT 日期,我还需要加入第三个表以限制为某种类型的产品(例如 ForSale)。 我尝试了两种不同的方法,它们都有效并返回相同的数据,但两者都需要很长时间才能自动执行此报告:

select months.mon, count(distinct d.productID), d.ProductAttr
from (select '2008-10' as mon union all
  select '2008-11' union all
  select '2008-12' union all
  select '2009-01'
 ) months left outer join
 on months.mon >= date_format(t.Indate, '%Y-%m') and 
    (months.mon <= date_format(t.OutDate, '%Y-%m') or t.OutDate is NULL)
join x on x.product_id = t.product_id and x.type = 'ForSale'
join d on d.product_id = x.product_id and d.type = 'Attribute'
group by months.mon, d.ProductAttr;

还通过为 product 属性和 where/exclusion 添加子查询来尝试上述没有最后两个连接的方法 - 这似乎运行大致相同或稍慢:

select months.mon, count(distinct t.productID), (select ProductAttr from d where productid = t.productID and type = 'attribute' limit 1)
from (select '2008-10' as mon union all
  select '2008-11' union all
  select '2008-12' union all
  select '2009-01'
 ) months left outer join
 on months.mon >= date_format(t.Indate, '%Y-%m') and 
    (months.mon <= date_format(t.OutDate, '%Y-%m') or t.OutDate is NULL)
WHERE exists (select 1 from x where x.productid = t.productID and x.type = 'ForSale')
group by months.mon, d.ProductAttr;

想法都可以通过我需要总共依赖 3 个源表(1 个仅用于排除)的额外数据来提高效率。 提前谢谢。

您可以通过生成所需月份的列表来执行此操作。 最简单的方法是在MySQL中手动执行此操作(尽管在Excel中生成代码可以使此操作更容易)。


select months.mon, t.ProductAttr, count(distinct t.productID)
from (select '2008-10' as mon union all
      select '2008-11' union all
      select '2008-12' union all
      select '2009-01'
     ) months left outer join
     on months.mon >= date_format(t.Indate, '%Y-%m') and 
        (months.mon <= date_format(t.OutDate, '%Y-%m) or t.OutDate is NULL)
group by t months.mon, t.ProductAttr;

此版本将所有比较作为字符串执行。 您正在处理"月"的粒度,并且格式 YYYY-MM 在比较方面做得很好。


您确实需要每个月在输出中所需的内容。 如果你每个月都有产品进来,那么你可以做:

select months.mon, t.ProductAttr, count(distinct t.productID)
from (select distinct date_format(t.InDate, '%Y-%m') as mon
      from t
     ) months left outer join
     on months.mon >= date_format(t.InDate, '%Y-%m') and
        (months.mon <= date_format(t.OutDate, '%Y-%m) or t.OutDate is NULL)
group by t months.mon, t.ProductAttr;

