201116西瓜书机器学习系列---16、强化学习

201116西瓜书机器学习系列---16、强化学习

一、总结

一句话总结:

【强化学习的应用非常非常广泛】
【AlphaGo代表着双人完美信息零和游戏。AlphaGo在围棋这么难的问题上取得了举世瞩目的成绩;AlphaGo是人工智能的一个里程碑。】
【Deepmind AlphaStar打败了星际争霸人类高手】。Deepmind在一款多人抢旗游戏中达到了人类玩家水平。OpenAI Five打败了人类刀塔高手。OpenAI训练了类人机器人手Dactyl, 用于灵活地操纵实物。
【谷歌人工智能把强化学习用到数据中心制冷这样一个实用系统。】DeepMimic模拟人形机器人,掌握高难度的运动技能。强化学习也应用于化学分子逆合成和全新药物设计。等等。

二、内容在总结中

博客对应课程的视频位置:

 
我的旨在学过的东西不再忘记(主要使用艾宾浩斯遗忘曲线算法及其它智能学习复习算法)的偏公益性质的完全免费的编程视频学习网站: fanrenyi.com;有各种前端、后端、算法、大数据、人工智能等课程。
博主25岁,前端后端算法大数据人工智能都有兴趣。
大家有啥都可以加博主联系方式(qq404006308,微信fan404006308)互相交流。工作、生活、心境,可以互相启迪。
聊技术,交朋友,修心境,qq404006308,微信fan404006308
26岁,真心找女朋友,非诚勿扰,微信fan404006308,qq404006308
人工智能群:939687837

作者相关推荐

原文地址:https://www.cnblogs.com/Renyi-Fan/p/14008916.html