有趣的机器学习视频-第五章.进化算法

5.1 什么是遗传算法

用二进制表示个体

用遗传信息和变异产生个体，然后通过适者生存进行

不再使用01表示，这些实数可以看做是某些待优化目标函数的参数值
同样可以用遗传，但是如何产生变异？
变异强度：将双方的值取均值，附加一个标准差，就可以构造一个正态分布，产生相近的数

在进化理论中，传递给后代的是均值和变异强度
进化理论可以用于神经网络的参数优化上

机器学习很多时候和神经网络有关
用进化理论进行神经网络更新

用梯度的神经网络适合监督学习：比如计算机识图

梯度下降：只需要梯度，如果是梯度学习，速度会非常快，梯度指明了最佳的下降方向，如果是监督学习优化非常快

进化：用原始的点创建很多新的点，然后通过新的点确定下一个起始点在哪里
在测试中需要生成很多新的点，会比梯度法慢很多，但是可以有效避免局部最优

可以用进化理论的神经网络做强化学习
基于进化策略的神经网络完全可以替代基于梯度的强化学习方法，因为宝宝众多，所以可以并行·