我目前正在处理一个财务数据问题。我想检测模型产生异常θ值的交易(由于几个因素(。
我的数据主要包括交易及其概况变量,如dealId、投资组合等,以及不同日期(可追溯到3年(的不同θ值和θ分量。我目前使用的数据如下:
Tradeid | 日期1 | 日期2等等 |
---|---|---|
id1 | 1234 | 1238 |
id2 | 1289 | 1234 |
对于机器学习世界来说,您的问题似乎太简单了
您可以手动定义数据异常的阈值并识别它们。
要做到这一点,您可以使用panda轻松地分析数据,找出平均值、最大值、最小值等,然后继续定义阈值。