AlphaGo、AlphaGo zero、Alpha zero

1.神经网络介绍

2.MCTS介绍

3.AlphaGo zero执行过程(伪代码)

参考文章链接:https://blog.csdn.net/hhy_csdn/article/details/86759692

一、AlphaGo

1、事件

2016年初,AlphaGo战胜李世石,核心技术深度强化学习受到人们的广泛关注和研究,取得了丰硕的理论和应用成果。

2、主要机制

两个神经网络:策略网和评价网络

原文地址:https://www.cnblogs.com/qianwangxingfu/p/11603909.html