我正在尝试创建一种学会玩挥舞着鸟的遗传算法。我的游戏有效,这是我的鸟类课:
public class Bird extends Player {
public NNetwork network;
public Bird(float x, float y, float velX, float velY, float width, float height) {
super(x, y, velX, velY, width, height);
NTopology topo = new NTopology(3,5,1);
network = new NNetwork(topo, 0.1f, 0.1f, true);
}
public void reset() {
setAlive(true);
setX(0f);
setY(1000f);
setVelY(0f);
}
/**
* Feeds the parameters into the neural net
* @param dyTop height difference to the top edge
* @param dyBot height difference to the bottom edge
* @param dx distance to the obstacles
* @return true if the bird thinks it would be good to jump
*/
public void jump(float dyTop, float dyBot,float dx) {
network.feed(dyTop, dyBot, dx);
if(network.getOutputs()[0]>0f) super.flap();
}
public void update(float dyTop, float dyBot, float dx) {
super.update();
jump(dyTop, dyBot, dx);
}
public Bird mutate() {
Bird ret = this;
ret.network.mutate();
ret.setAlive(true);
ret.setScore(0f);
ret.setX(0);
ret.setY(1000);
return ret;
}
}
这些是种群突变函数
public ArrayList<Bird> sortBirds(ArrayList<Bird> birds) {
ArrayList<Bird> ret = birds;
Collections.sort(ret, new Comparator<Bird>() {
@Override
public int compare(Bird bird, Bird t1) {
return bird.getScore() < t1.getScore() ? 1 : -1;
}
});
lastBestScore = ret.get(0).getScore();
return ret;
}
public ArrayList<Bird> repopulate(ArrayList<Bird> birds) {
birds = sortBirds(birds);
Bird bestBird = this.birds.get(0);
Bird[] retA = new Bird[birds.size()];
birds.toArray(retA);
retA[0] = bestBird;
for(int i = 0; i < 3; i++) { //replace the 3 worst birds with mutations of the best one (there are always at least 5 birds)
retA[retA.length-1-i] = bestBird.mutate();
}
ArrayList<Bird> ret = new ArrayList<>(Arrays.asList(retA));
for(Bird b : ret) {b.reset();}
generation++;
return ret;
}
bird.reset((函数只是恢复了鸟并将其设置回开始。当每只鸟死了时,称为((。从理论上讲,这些功能应该随着时间的流逝而改善我的人口,但是当鸟比其他鸟更好时,下一代也很糟糕。
我是否误解了遗传算法的工作原理,还是代码中有错误?(如果您需要更多代码,我可以将其发布(
首先,您的代码中没有交叉,这很糟糕。它通常给出更好的结果。
其次,您是否只保留最佳的基因组和3个突变,其余的人群才会从头开始再生? - 这不会很好,因为您需要更多的多样性。
如果您想单独使用突变,我建议将最好的一半克隆到新一代,而另一半 - 最好的一半突变。但是我敢肯定,在这种情况下,您也会陷入本地最大最大的位置,但这将比您如何做。
从我对脆弱鸟的经验来看,您最好从恒定的列开始,因为鸟类的学习更简单,并且调试更容易。