学习进度笔记25

学习进度笔记25

《机器学习十讲》第十讲强化学习

一、马尔可夫决策过程MDP

二、基于价值的方法

Q-Learning

DQN

三、基于策略的方法

策略梯度算法

四、总结

机器学习——》微积分、概率论、优化方法、统计学

——》python、数据结构、数据库

数据采集、数据管理、数据清洗、数据可视化

深度学习、强化学习

NLP、网络分析。。。。。

与相应行业结合

学习建议

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/songxinai/p/14379468.html