在过去的几天里,我一直在使用马尔可夫链来建立多点(数据驱动(归因模型,我发现了太多宏观层面的重要信息,例如,ChannelAttribution
包为我提供了实现转换过程中每个频道的属性(电视、搜索或呼叫中心(,但该属性是在考虑所有客户旅程以及每个频道的消除效果的情况下完成的。我的问题是,在微观层面的分析中,我可以在客户层面获得哪一个渠道最能归因于他们的购买决定吗?也就是说,哪个渠道对他们每个客户的购买影响最大?是否进行转换并不重要。
例如,我想象如下输出:
Curtomer ID | 通道Curtomer分布 | 转换||
---|---|---|---|
1 | 电视 | 转换||
2 | 电视 | 转换 | |
3 | 搜索 | 非转换||
4 | 呼叫中心 | 转换 | |
5 | 电视 | 非转换 | |
6 | 呼叫中心 | 转换 |
很抱歉回复太晚,也许这对其他人有帮助。
你需要做的第一件事是让你的数据成形,特别是一个长形状。我在下面为您的输出表中的前3个客户ID构建了一个示例:
|客户ID |渠道|转换||----------|------------|--------------||1|TV|转换||1|TV|转换||1|呼叫中心|转换||2|TV|转换||2|TV|转换||3|搜索|转换||3|搜索|不转换||3|呼叫中心|非转换|请注意,如果查看每个客户ID最受欢迎的频道,它将对应于您的输出表中的"channel Atribution by curtomer"字段?
您可以通过以下方式完成:
- 对客户ID和转换进行分组(转换客户ID关系应为1比1(
- 统计每个客户的渠道发生的次数,这将为您提供
客户ID | 通道 | 转换通道计数 | |
---|---|---|---|
1 | 电视 | 转换2 | |
1 | 电视 | 转换2 | |
1 | 呼叫中心 | 转换1 | |
2 | 电视 | 转换2 | |
2 | 电视 | 转换2 | |
3 | 搜索 | 非转换2 | |
3 | 搜索 | 非转换2 | |
3 | 呼叫中心 | 非转换1 |