自我监督学习在过去几年中呈上升趋势。与其他学习方法(如监督式和半监督式)相比,它确实有一个优势,因为它不需要标记数据。
我想知道自监督学习是否有任何缺点,半监督学习在哪些方面比它更好。
我认为最好的方式来说明这个问题是引用伟大的Yann LeCun:
如果智力是一块蛋糕,那么这块蛋糕的大部分是无人监督的学习,锦上添花的是监督学习,而樱桃在蛋糕上是强化学习(RL)。
根据具体情况,不同类型的ML可能非常好,也可能不好。例如,对于机器人或自动驾驶问题,考虑到这些算法的性质,强化学习将是理想的解决方案。然而,对于推荐系统或股票价格预测器,你可能会在监督和非监督学习中找到更好(和更简单)的解决方案。
强化学习与监督学习和无监督学习非常不同,因为它需要根据智能体、状态和环境来定义,而不是简单地根据数据(在监督学习的情况下还有标签)来定义。因此,您将需要这些元素,并非常仔细地定义它们之间的相互作用,以训练一个良好而可靠的系统,正如我上面提到的,对于您试图解决的问题,这个系统可能不是最优的(甚至是可行的)解决方案。