小贝子编程

将连续映射为连续的强化学习方法

我正在构建一个模型，在这个模型中，企业必须制定价格并做出生产决策。价格是连续的，决策变量也是连续的。（库存、上次销售、价格…）。

我可以使用什么强化学习方法将连续映射到连续？有哪些python包？如果没有python包，我可以编写一个包装器。

PyBrain机器学习库就是您想要的。这是一个相当复杂的神经网络实现，但当你理解它时，你会得到一个非常强大的工具。

PyBrain是一个用于神经网络建模的python库。PyBrain的概述应该会让你有一个基本的想法：在每个时间戳，你为神经网络提供一组连续值，并取出另一组连续的值。但更重要的是，你可以评估输出并训练你的神经网络。

所有这些步骤——包括网络训练——都已经在PyBrain中实现了。

相关内容