学习进度笔记25

《机器学习十讲》第十讲 强化学习

一、马尔可夫决策过程MDP

二、基于价值的方法 

Q-Learning

DQN

三、基于策略的方法

策略梯度算法

四、总结

机器学习——》微积分 、概率论、优化方法、统计学

              ——》python、数据结构、数据库

数据采集、数据管理、数据清洗、数据可视化

深度学习、强化学习

NLP、网络分析。。。。。

与相应行业结合

 学习建议

原文地址:https://www.cnblogs.com/songxinai/p/14379468.html