围棋吧 关注:345,432贴子:10,397,682
  • 25回复贴,共1

AlphaGo教学工具的正确用法:需要考虑对手的最强回应

只看楼主收藏回复

举个例子。如果打开 https://alphagoteach.deepmind.com/zh-hans ,看上去黑棋星位的胜率是47.1,小目的胜率是46.7。
但其实应该再考虑多一些:
下星位后,白棋最强的是星位,黑棋胜率降到46.6。这其实才更接近黑棋星位的真实胜率。
下小目后,白棋最强的回应是Q4,黑棋胜率降到46.2。这其实才更接近黑棋小目的真实胜率。
当然,可能白棋不一定会用最强应法,不过我们不能指望这个。
同样,白棋也不能只选“一眼看上去让黑棋分数最低的”,也应该考虑黑棋的最强应法,下一个能让黑棋最难应的。
所以,在考虑之后,还可以进一步修正刚才这些的胜率估计。
这就是极大极小博弈树的思想:不能只选当前看上去分数最高的。需要再看后续变化,修正分数。看的层数越多,分数就越来越准确。
最终如果是棋神,那么棋盘上所有点的胜率就只有0%和100%这两种可能性。


IP属地:广东1楼2017-12-12 11:10回复
    实际来说,还要注意,目前这些胜率估计仍然是有噪音的,所以在“极大极小化”时不能太极端


    IP属地:广东2楼2017-12-12 11:12
    回复
      这个胜率是MASTER算了10分钟后的 你说的这个过程应该就是MASTER10分钟在做的事情吧 人不可能做的更好
      所以直接看胜率吧


      IP属地:浙江3楼2017-12-12 11:39
      收起回复
        不能自己任意选点,呆板无用,辣鸡!


        IP属地:重庆4楼2017-12-12 12:27
        收起回复
          楼主果然厉害,细品确实是这样子。


          来自Android客户端5楼2017-12-12 12:28
          回复
            好笑,开局给你一个80%胜率,该跪还是要跪


            IP属地:广东来自Android客户端6楼2017-12-12 12:36
            回复
              黑开局的47%胜率是守不住的,10手以后,基本上黑都要掉到45-46
              另外守住胜率对黑走法要求很高,一不小心就亏了,而白走法相对自由,基本怎么走胜率都能50以上


              IP属地:北京7楼2017-12-12 12:36
              回复
                有一点需要说明,就是黑白都走正手的情况下,黑棋的胜率也是自然下降的,因为离终局越来越近,黑棋翻盘的可能性越来越小


                IP属地:上海来自iPhone客户端9楼2017-12-12 13:41
                收起回复
                  胜率就是当前局面的最佳招法,已反应了后续招法,不用再考虑max-min。
                  后续招法胜率降低,是因为随着计算加深,发现了新的招法,导致前面评估不准需要调整。
                  围棋之神没有计算深度的问题,所以第一招能算出真实胜率


                  IP属地:重庆10楼2017-12-12 15:14
                  收起回复
                    反正法:
                    如果你假设这一手之后的每一手都是最强回应,那么这一手的胜率毫无疑问是0%或者100%。
                    那么胜率显示就无意义。故不需要假设之后每一手都是最强回应


                    IP属地:浙江12楼2017-12-12 15:32
                    收起回复
                      统计学上来说,当前胜率=Σ对手应手的胜率*该应手落子概率
                      故不能仅仅考虑最佳应手


                      IP属地:江苏13楼2017-12-12 15:38
                      收起回复
                        三点观察:
                        (1) 就MCTS算法而言,考虑子节点的min/max或许并不恰当,应该考虑某种加权平均(如依照policy head概率分布的平均);平均的胜率升高应该大致等于平均的胜率降低,如果差别大,说明神经网络并不完美,MCTS起到了效果。
                        (2) Julian Schrittwieser在reddit AMA中表示白棋在测试中的胜率为55%(说的多半是AlphaGo Zero),现在AlphaGo Teach开局时白棋胜率显示为52.9%,说明网络尚未达至完美,毕竟是基于Master版本的,不知道Zero的起始胜率又如何。https://www.reddit.com/r/MachineLearning/comments/76xjb5/ama_we_are_david_silver_and_julian_schrittwieser/doljugm/
                        (3) DeepMind从未说过黑白胜率差距很大:放出的自我对战并不太能说明问题,因为是经过选择的(比如说AlphaZero就只放出了战胜Stockfish的10局棋,而没有平局),或许这些比较精彩激烈的对局白棋胜率较高,又或许Zero比Master和Lee更擅于下白棋,而执黑的进步没有那么大。


                        IP属地:美国14楼2017-12-12 16:49
                        回复
                          按照这帖子里对棋神的想象,那电脑ai是永远下不赢人的。


                          IP属地:四川15楼2017-12-23 00:38
                          收起回复