201116西瓜书机器学习系列---16、强化学习

201116西瓜书机器学习系列---16、强化学习

一、总结

一句话总结：

【强化学习的应用非常非常广泛】

【AlphaGo代表着双人完美信息零和游戏。AlphaGo在围棋这么难的问题上取得了举世瞩目的成绩；AlphaGo是人工智能的一个里程碑。】

【Deepmind AlphaStar打败了星际争霸人类高手】。Deepmind在一款多人抢旗游戏中达到了人类玩家水平。OpenAI Five打败了人类刀塔高手。OpenAI训练了类人机器人手Dactyl, 用于灵活地操纵实物。

【谷歌人工智能把强化学习用到数据中心制冷这样一个实用系统。】DeepMimic模拟人形机器人，掌握高难度的运动技能。强化学习也应用于化学分子逆合成和全新药物设计。等等。

二、内容在总结中

博客对应课程的视频位置：

我的旨在学过的东西不再忘记（主要使用艾宾浩斯遗忘曲线算法及其它智能学习复习算法）的偏公益性质的完全免费的编程视频学习网站： fanrenyi.com；有各种前端、后端、算法、大数据、人工智能等课程。

版权申明：欢迎转载，但请注明出处

一些博文中有一些参考内容因时间久远找不到来源了没有注明，如果侵权请联系我删除。

聊技术，交朋友，修心境，qq404006308，微信fan404006308

人工智能群：939687837

作者相关推荐

感悟总结

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/Renyi-Fan/p/14008916.html