深度学习课程笔记(十三)深度强化学习 --- 策略梯度方法(Policy Gradient Methods)

深度学习课程笔记(十三)深度强化学习 --- 策略梯度方法(Policy Gradient Methods)

2018-07-17 16:50:12 

 

Reference: https://www.youtube.com/watch?v=z95ZYgPgXOY&t=512s  

 

 

原文地址:https://www.cnblogs.com/wangxiaocvpr/p/9324258.html