r语言 - 用于价格优化的多臂老虎机分析



最近,我读了一篇题为"土匪知道最好的产品价格"的博客文章"(http://pkghosh.wordpress.com/2013/08/25/bandits-know-the-best-product-price/),概述了如何使用多臂老虎机分析进行价格优化。

关于多臂老虎机分析是否比 A/B 测试更好也有很多讨论(例如,"每次都会击败 A/B 测试的 20 行代码":http://stevehanov.ca/blog/index.php?id=132?utm_medium=referral 与"为什么多臂老虎机算法不比 A/B 测试'更好'":http://visualwebsiteoptimizer.com/split-testing-blog/multi-armed-bandit-algorithm/)。

我知道有一个名为"bandit"的R包,可用于此类分析。

是否有人有一个玩具示例 - 与博客文章中的示例相当 - 展示了如何使用R(在价格优化的上下文中)应用此方法?

感谢您的帮助。

我最近正在做一个关于强盗算法的项目。基本上,老虎机算法的性能在很大程度上取决于数据集。它非常适合使用搅动数据进行持续测试。因此,您需要做什么来测试和调整基于测试数据的模型。

对于底层老虎机,可以阅读这本书,用于网站优化的老虎机算法:http://shop.oreilly.com/product/0636920027393.do。它很好地解释了基本的老虎机算法,并在Python中实现。你可以在Github中找到它的代码:https://github.com/johnmyleswhite/BanditsBook。但是,他们在书中没有谈论上下文强盗。

对于R,我不太确定。但是我只是在网上搜索,我发现一个人在R中实现了土匪,这是代码:https://github.com/lotze/bandit

希望它能帮助你。

我对这个话题的谨慎探索可能对你有用:http://codeandmath.wordpress.com/2014/04/05/type-i-error-in-bandits/

我知道你要求在R中输入代码,但实现通常非常简单。我认为这可能是相关的。如果您将二进制数据替换为连续数据,则该算法有效,因为奖励只是平均值。因此,请随意使用相同的数据(如价格)并替换(用一些随机数替换)。

最新更新