temporal credit assignment in reinforcement learning 【强化学习 经典论文】

Sutton 出版论文的主页:

http://incompleteideas.net/publications.html

Phd  论文:   temporal credit assignment in reinforcement learning  

http://incompleteideas.net/publications.html#PhDthesis 

 最近在做强化学习方面的课题, 发现在强化学习方面被称作强化学习之父的  Sutton  确实很厉害, TD算法和策略梯度策略算法都是他所提出的, 虽然Reinforcement learning 的现在框架是从 Q-learning 开始确定的,但是强化学习做的最早的人之一,对强化学习中经典思想的贡献最多的人估计就是Sutton了,Sutton本硕都是在MIT读的心理学,博士阶段才读的计算机,看来确实是很强的。作为强化学习最经典的论文,也是Sutton的博士毕业论文,很是值得读一读的,寻找该篇论文许久,发现可能是由于该篇论文发表的时间过久,所以所有的数据库都没有收录,唯一收入的应该是Sutton的博士授予的大学 Massachusetts 马萨诸塞州大学,但是由于该文章只向本校学生开发,所以找了几天都没有找到,今天灵机一动,为什么不到作者的个人主页上找一找呢,这一弄还果然发现了它的存在,特此mark一下。

 

----------------------------------------------------------------------------------------------------------------

----------------------------------------------------------------------------------------------------------------

附:(Sutton主页  Publication部分内容)

Rich Sutton's Publications

First, a quick guide to the highlights, roughly in order of the work's popularity or potential current interest:

Also, some RL pubs that aren't mine, available for researchers:


For any broken links, please send email to rich@richsutton.com.

原文地址:https://www.cnblogs.com/devilmaycry812839668/p/10705075.html