本人是计算机行业从业人员,以前做过人工智能的一些相关开发。这里看到吧友对狗的下棋有一些误解,
比如穷举啥的,想用一些通俗的说法描述一下,有不对的地方请批评指正,计算机基础好的朋友请略过此文。
拟人描述法:
阿发狗下棋时,其实后面有两个团队,即大师团队(神经网络)和验证团队(搜索算法)。
大师团队有两个很牛的大师,一个落子大师(策略网络),一个形势评估大师(价值网络),
这两个大师牛的地方在于之前已经看过了几百上千万的棋局,甚至可以说把古今中外公开的棋局
全部都看过了一遍,甚至无聊的时候自己还和自己下了很多很多遍的棋。
通过这海量的学习得到了极为深厚的棋局经验。
在狗下子前,先由这两个大师给出一些意见,比如落子大师说我觉得下这几个地方比较好,
然后评估大师说我觉得下哪几个地方形势会更好。大师的意见出来后,验证团队就开始上阵。
验证团队可以认为是由成千上万的棋手帮忙验证大师的意见,团队中的人分别走大师给出的几种下发,
然后一直下到结束,看看到底哪一步最好,最后把结果交给狗。
比如穷举啥的,想用一些通俗的说法描述一下,有不对的地方请批评指正,计算机基础好的朋友请略过此文。
拟人描述法:
阿发狗下棋时,其实后面有两个团队,即大师团队(神经网络)和验证团队(搜索算法)。
大师团队有两个很牛的大师,一个落子大师(策略网络),一个形势评估大师(价值网络),
这两个大师牛的地方在于之前已经看过了几百上千万的棋局,甚至可以说把古今中外公开的棋局
全部都看过了一遍,甚至无聊的时候自己还和自己下了很多很多遍的棋。
通过这海量的学习得到了极为深厚的棋局经验。
在狗下子前,先由这两个大师给出一些意见,比如落子大师说我觉得下这几个地方比较好,
然后评估大师说我觉得下哪几个地方形势会更好。大师的意见出来后,验证团队就开始上阵。
验证团队可以认为是由成千上万的棋手帮忙验证大师的意见,团队中的人分别走大师给出的几种下发,
然后一直下到结束,看看到底哪一步最好,最后把结果交给狗。