A已经读过关于A*和D*以及类似的东西,我无法在它们之间做出选择。当有很多搜索(每勾50次搜索)和许多不同的可能性时,最好的搜索算法是什么?
在两者之间,我会选择D*。D*特别假设一条最佳路径,但如果遇到障碍,则重新计算。这意味着每个爬行者都可以对出口路径有自己的个人看法,当爬行者遇到障碍时,出口路径会更新。
这种对行为调整的最佳路径的假设稍微更现实一些,就好像你或我在这条路上行走,我们在了解障碍之前不会避开它们。如果有人(玩家)建造了一座新塔,它也很好地解释了路径的重新计算。如果你能很好地平衡开放节点的扩展,你甚至可能会有爬行者在位于最佳路径中心的塔的两侧行走。
然而,如果你想真正让它变得有趣,就采取一种基于学习的最佳路径查找方法。比其他解决方案有趣得多。要查看示例,请查看类似antbuster
的内容。也许它太有趣了,不太适合标准的塔防游戏类型。
Q-Learning可能是一个不错的选择。Q-Learning试图绘制出一个惩罚/收益网格,在有限的世界中做出局部决策会带来惩罚/收益。