我想制作一个在python中使用强化学习进行训练的神经网络。
X -> [ANN] -> yEstimate -> score! -> (repeat until weights are optimised)
我现在正在使用Scikit学习,但似乎并没有所有的神经网络都试图将yEstimate
与yTarget
相匹配。
scikit是否有学习的秘密,或者是否有其他我不知道的图书馆可以实现这一点?
谢谢!
Google TensorFlow是一个大型库,具有用于创建神经网络的Python接口。看见https://github.com/nivwusquorum/tensorflow-deepq了解有关强化学习的更多信息和示例。
这里有一个例子http://pybrain.org/
这里是另一个https://pypi.python.org/pypi/Reinforcement-Learning-Toolkit/1.0
机器人领域有许多研究小组使用强化学习。如果你不喜欢我给你的,你可以试着在这些组中查找