举个例子。如果打开 https://alphagoteach.deepmind.com/zh-hans ,看上去黑棋星位的胜率是47.1,小目的胜率是46.7。
但其实应该再考虑多一些:
下星位后,白棋最强的是星位,黑棋胜率降到46.6。这其实才更接近黑棋星位的真实胜率。
下小目后,白棋最强的回应是Q4,黑棋胜率降到46.2。这其实才更接近黑棋小目的真实胜率。
当然,可能白棋不一定会用最强应法,不过我们不能指望这个。
同样,白棋也不能只选“一眼看上去让黑棋分数最低的”,也应该考虑黑棋的最强应法,下一个能让黑棋最难应的。
所以,在考虑之后,还可以进一步修正刚才这些的胜率估计。
这就是极大极小博弈树的思想:不能只选当前看上去分数最高的。需要再看后续变化,修正分数。看的层数越多,分数就越来越准确。
最终如果是棋神,那么棋盘上所有点的胜率就只有0%和100%这两种可能性。
但其实应该再考虑多一些:
下星位后,白棋最强的是星位,黑棋胜率降到46.6。这其实才更接近黑棋星位的真实胜率。
下小目后,白棋最强的回应是Q4,黑棋胜率降到46.2。这其实才更接近黑棋小目的真实胜率。
当然,可能白棋不一定会用最强应法,不过我们不能指望这个。
同样,白棋也不能只选“一眼看上去让黑棋分数最低的”,也应该考虑黑棋的最强应法,下一个能让黑棋最难应的。
所以,在考虑之后,还可以进一步修正刚才这些的胜率估计。
这就是极大极小博弈树的思想:不能只选当前看上去分数最高的。需要再看后续变化,修正分数。看的层数越多,分数就越来越准确。
最终如果是棋神,那么棋盘上所有点的胜率就只有0%和100%这两种可能性。