将连续映射为连续的强化学习方法



我正在构建一个模型,在这个模型中,企业必须制定价格并做出生产决策。价格是连续的,决策变量也是连续的。(库存、上次销售、价格…)。

我可以使用什么强化学习方法将连续映射到连续?有哪些python包?如果没有python包,我可以编写一个包装器。

PyBrain机器学习库就是您想要的。这是一个相当复杂的神经网络实现,但当你理解它时,你会得到一个非常强大的工具。

PyBrain是一个用于神经网络建模的python库。PyBrain的概述应该会让你有一个基本的想法:在每个时间戳,你为神经网络提供一组连续值,并取出另一组连续的值。但更重要的是,你可以评估输出并训练你的神经网络。

所有这些步骤——包括网络训练——都已经在PyBrain中实现了。

最新更新