我有一些数据可以说明某个影响者是否是机器人。当然,目标数据是二进制值。我需要使用这些完整的数据来计算影响者的分数,而不是直接预测。所以在这里,我有三个选项,没有确切的答案,我可以找到使用哪一个。数据来自Instagram API,我将尝试一些功能或从其他人的工作中挑选一些。
- 我应该训练一个分类器并从最后一层去除sigmoid函数以获得连续值并用作分数吗;在python中可以做到这一点吗
- 有没有一种方法可以用二进制目标数据训练回归器?这合适吗
- 还是我只能选择用我所掌握的信息为分数创建一个类似参与的公式
请指导,因为我是一个新手,现在完全被卡住了。
这正是逻辑回归的作用-它计算输入为类1的概率。
假设你选择你的标签是[bot,no-bot] = [1,0]
,那么它会给你一个输入是机器人的概率