有趣的机器学习视频-第五章.进化算法

TOC

5.1 什么是遗传算法

用二进制表示个体

5.2 进化策略

用遗传信息和变异产生个体,然后通过适者生存进行

不再使用01表示,这些实数可以看做是某些待优化目标函数的参数值
同样可以用遗传,但是如何产生变异?
变异强度:将双方的值取均值,附加一个标准差,就可以构造一个正态分布,产生相近的数

在进化理论中,传递给后代的是均值和变异强度
进化理论可以用于神经网络的参数优化上

5.2 神经网络进化

机器学习很多时候和神经网络有关
用进化理论进行神经网络更新

  • 遗传算法
    将两个神经网络进行部分融合,然后进行一定的变异,接着进行适者生存
  • 进化策略
    更加趋于先确定神经网络的结构,然后基于结构进行连接强度变异,在下一步的父网络是之前所有子网络的复合体,好的子网络占有的比例更加多(反向传播)

用梯度的神经网络适合监督学习:比如计算机识图

梯度下降:只需要梯度,如果是梯度学习,速度会非常快,梯度指明了最佳的下降方向,如果是监督学习优化非常快

进化:用原始的点创建很多新的点,然后通过新的点确定下一个起始点在哪里
在测试中需要生成很多新的点,会比梯度法慢很多,但是可以有效避免局部最优

可以用进化理论的神经网络做强化学习
基于进化策略的神经网络完全可以替代基于梯度的强化学习方法,因为宝宝众多,所以可以并行·

原文地址:https://www.cnblogs.com/volva/p/d34a25de700a8fb43634c39293b5dd39.html