1、强化学习的样本通过不断与环境进行交互产生,即试错学习,而监督学习的样本由人工收集并标注。
2、强化学习的反馈信息只有奖励,并且是延迟的,而监督学习需要明确的指导信息(每一个状态对应的动作)。
强化学习和监督学习的区别
博客内容用于记录自己学习后的收获,如有侵权请联系我删除
1、强化学习的样本通过不断与环境进行交互产生,即试错学习,而监督学习的样本由人工收集并标注。
2、强化学习的反馈信息只有奖励,并且是延迟的,而监督学习需要明确的指导信息(每一个状态对应的动作)。