我们的团队开发了一个细粒度的个人客户级别ML模型,该模型可以预测给定数量的促销(电话,电子邮件,会议,印象等)和一些客户分类细节(地址,名称,细分等)产生的收入(因变量)。
一旦模型就位,我们应该给出最优的";在某些限制条件下,个人层面的收益最大化的促销活动(游戏邦注:如在一定数量下的整体促销支出等),每个促销活动都有成本,所以从本质上讲,这些限制条件就像是独立功能值的界限。
目前我们模拟了所有可能的促销值对于电话,电子邮件,会议,印象等(分类变量不会因个人客户而改变),并通过模型预测获得每个人的最佳可能收入情况。
当前方法的问题是它是一个暴力破解方法. 我们有大约100万客户,模拟各种数量的促销条目(大量组合)将最终获得大量数据,预测本身需要花费大量时间。
考虑到这是一个简单的最大化问题,但它具有ML模型预测输出(在我们的情况下是神经网络)作为给定输入特征的函数,我们正在寻找任何优化器这可以解决这个问题,而不需要数据模拟。它就像excel中的求解函数,其中目标函数是ML模型预测。
一个简单的类比-加州房价是一个众所周知的ML回归问题。假设我们有一个完善的模型(非参数模型,比如神经网络),在没有明确模拟数据的情况下,我们如何估计每个县的房价最大值的最佳特征值(有一些约束)(想象数据也有县信息)。
我建议您研究一下LIME或SHAP等解决方案:
- https://github.com/slundberg/shap -通过博弈论解释模型。
- https://github.com/marcotcr/lime -通过局部可解释的拟合进行模型解释。