根据季度销售额在Pandas数据帧中插入行



我有一个数据集,其中包含这样的数据:

Customer, Quarter, TotalSales
Customer1, Q1, 2000
Customer2, Q1, 1232
Customer1, Q2, 432423
Customer2, Q2, 2222
Customer1, Q3, 242343
...

我们希望根据各个日期将其插入到更细粒度的视图中。是否有可能以某种方式平滑每个季度3个月的销售数据,使该季度的总销售额仍然相同,但仍然使值与季度前后的数据相匹配?

Customer, Quarter, Daily Sales
Customer1, 2020-01-01, interpolated value
Customer1, 2020-01-02, interpolated value
Customer1, 2020-01-03, interpolated value
....
Customer1, 2020-01-31, interpolated value
^ sum of these still add up to  Customer1, Q1, 2000
...

有一类方法被称为"时间分解";方法。看看上面的这个包裹GitHub。基本上,您可以指定一个较低频率的时间序列,并将其转换(外推(为较高频率的时间系列。我只在R中使用过这个包,但python的实现似乎应该基本相同。您可以指定较高频率的观测值是否应与较低频率的观测结果相加(或其他值(。

最新更新