我有一个公司日销售额的数据集。列为,类别代码(4个类别(,商品代码(195个商品(,日期ID(2021年9月1日至2022年2月1日(,每日销售额(数量(。
在评估和测试中,我必须预测2022年2月14日至2022年3月13日的每周销售额。列为类别代码、项目代码、周数(w1、w2、w3、w4(。在val集中,我有每周的销售量,在测试集中,我必须预测每周的销售量。
因为我的火车有每日销售,没有星期号,我很困惑如何解决这个问题。我没有他们在val和测试集中给出的月份销售额的历史数据。
我应该将火车上设置为周的日子映射为每个月的w1、w2、w3、w4吗?还有其他好方法吗?
我试图通过将每周销售额除以7来扩展val集,并将一周的一行替换为该周每天的7行,但这给了我非常糟糕的结果。
我必须使用MAPE度量。
欢迎加入社区!
既然你被要求每周进行预测,那么最好将你的训练数据转换为几周。
Panda方法是resample()
,您可以在这里的文档中了解更多信息。您可以将偏移字符串更改为需要匹配验证集生成方式的偏移字符串。所有可用的选择都可以在这里找到。
你可能会发现这也很有用。