强化学习ddpg算法 这个算法应用最多 Deep Deterministic Policy Gradient(DDPG), 收集资料学习一下。 例子代码 https://keras.io/examples/rl/ddpg_pendulum/ 算法解读 http://www.cs.sjsu.edu/faculty/pollett/masters/Semesters/Spring18/ujjawal/DDPG-Algorithm.pdf --- 她说, 她是仙,她不是神