任何预测工资的统计或机器学习方法



我在金融科技公司工作。我们为客户提供贷款。想要申请贷款的客户必须在我们的应用程序中填写一些信息,其中一条信息是工资信息。使用网络抓取,我们能够获取客户最近 3-7 个月的银行交易数据。

使用任何统计或机器学习技术,我如何轻松发现客户银行交易数据中是否说明了工资金额(或几乎相同(?我应该为每个客户创建一个模型(逻辑(,还是应该只为所有客户创建一个模型?

请告知

我认为你不需要机器学习。

  1. 在所有交易列表中,只保留那些向账户加钱的交易,而不是从账户中减去钱
  2. 将所有数字四舍五入到一定精度(例如 2510 美元 -> 2500 美元(
  3. 构建一个数据集,其中包含每天添加到帐户的总金额。换句话说,按天对交易进行分组,并在需要时添加 0
  4. 应用离散傅里叶变换以查找此时间序列中的周期分量
  5. 应该只有 1 个周期性项目,每 30 天重复一次
  6. 将所有其他周期重复项的值设置为 0
  7. 应用逆离散傅里叶变换以仅获取每 28/30 天重复一次的信息

有关傅里叶变换的更多信息,请查看 https://en.wikipedia.org/wiki/Fourier_transform

举一个实际的例子(使用MatLab(, 退房 https://nl.mathworks.com/help/matlab/examples/fft-for-spectral-analysis.html?requestedDomain=www.mathworks.com

它展示了如何给出时间信号的频率分解。如果你应用相同的逻辑,你可以使用这个频率分解来找出哪些频率是占主导地位的(通常薪水将是其中之一(。

最新更新