AlphaGo教学工具的正确用法：需要考虑对手的最强回应【围棋吧】

围棋吧关注：345,432贴子：10,397,682

25回复贴，共1页

AlphaGo教学工具的正确用法：需要考虑对手的最强回应

举个例子。如果打开 https://alphagoteach.deepmind.com/zh-hans ，看上去黑棋星位的胜率是47.1，小目的胜率是46.7。
但其实应该再考虑多一些：
下星位后，白棋最强的是星位，黑棋胜率降到46.6。这其实才更接近黑棋星位的真实胜率。
下小目后，白棋最强的回应是Q4，黑棋胜率降到46.2。这其实才更接近黑棋小目的真实胜率。
当然，可能白棋不一定会用最强应法，不过我们不能指望这个。
同样，白棋也不能只选“一眼看上去让黑棋分数最低的”，也应该考虑黑棋的最强应法，下一个能让黑棋最难应的。
所以，在考虑之后，还可以进一步修正刚才这些的胜率估计。
这就是极大极小博弈树的思想：不能只选当前看上去分数最高的。需要再看后续变化，修正分数。看的层数越多，分数就越来越准确。
最终如果是棋神，那么棋盘上所有点的胜率就只有0%和100%这两种可能性。

送TA礼物

IP属地:广东

1楼2017-12-12 11:10回复

实际来说，还要注意，目前这些胜率估计仍然是有噪音的，所以在“极大极小化”时不能太极端

IP属地:广东

2楼2017-12-12 11:12

这个胜率是MASTER算了10分钟后的你说的这个过程应该就是MASTER10分钟在做的事情吧人不可能做的更好
所以直接看胜率吧

IP属地:浙江

3楼2017-12-12 11:39

收起回复

不能自己任意选点，呆板无用，辣鸡！

IP属地:重庆

4楼2017-12-12 12:27

收起回复

楼主果然厉害，细品确实是这样子。

来自Android客户端5楼2017-12-12 12:28

好笑，开局给你一个80%胜率，该跪还是要跪

IP属地:广东

来自Android客户端6楼2017-12-12 12:36

黑开局的47%胜率是守不住的，10手以后，基本上黑都要掉到45-46
另外守住胜率对黑走法要求很高，一不小心就亏了，而白走法相对自由，基本怎么走胜率都能50以上

IP属地:北京

7楼2017-12-12 12:36

有一点需要说明，就是黑白都走正手的情况下，黑棋的胜率也是自然下降的，因为离终局越来越近，黑棋翻盘的可能性越来越小

IP属地:上海

来自iPhone客户端9楼2017-12-12 13:41

收起回复

胜率就是当前局面的最佳招法，已反应了后续招法，不用再考虑max-min。
后续招法胜率降低，是因为随着计算加深，发现了新的招法，导致前面评估不准需要调整。
围棋之神没有计算深度的问题，所以第一招能算出真实胜率

IP属地:重庆

10楼2017-12-12 15:14

收起回复

反正法：
如果你假设这一手之后的每一手都是最强回应，那么这一手的胜率毫无疑问是0%或者100%。
那么胜率显示就无意义。故不需要假设之后每一手都是最强回应

IP属地:浙江

12楼2017-12-12 15:32

收起回复

统计学上来说，当前胜率=Σ对手应手的胜率*该应手落子概率
故不能仅仅考虑最佳应手

IP属地:江苏

13楼2017-12-12 15:38

收起回复

三点观察：
(1) 就MCTS算法而言，考虑子节点的min/max或许并不恰当，应该考虑某种加权平均（如依照policy head概率分布的平均）；平均的胜率升高应该大致等于平均的胜率降低，如果差别大，说明神经网络并不完美，MCTS起到了效果。
(2) Julian Schrittwieser在reddit AMA中表示白棋在测试中的胜率为55%(说的多半是AlphaGo Zero)，现在AlphaGo Teach开局时白棋胜率显示为52.9%，说明网络尚未达至完美，毕竟是基于Master版本的，不知道Zero的起始胜率又如何。https://www.reddit.com/r/MachineLearning/comments/76xjb5/ama_we_are_david_silver_and_julian_schrittwieser/doljugm/
(3) DeepMind从未说过黑白胜率差距很大：放出的自我对战并不太能说明问题，因为是经过选择的（比如说AlphaZero就只放出了战胜Stockfish的10局棋，而没有平局），或许这些比较精彩激烈的对局白棋胜率较高，又或许Zero比Master和Lee更擅于下白棋，而执黑的进步没有那么大。

IP属地:美国

14楼2017-12-12 16:49

按照这帖子里对棋神的想象，那电脑ai是永远下不赢人的。

IP属地:四川

15楼2017-12-23 00:38

收起回复

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

25回复贴，共1页

<返回围棋吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴

日	一	二	三	四	五	六

AlphaGo教学工具的正确用法：需要考虑对手的最强回应

登录百度账号

扫二维码下载贴吧客户端