超参数搜索

什么是超参数

在神经网络的村联过程中不变的参数

有哪些是超参数

  • 网络结构参数:几层, 每层宽度,每层的激活函数等
  • 训练参数: batch_size, 学习率, 学习率衰减算法等

为什么要超参数搜索

搜索策略

  • 网格搜索

    定义N维方格, 每个方格对应一组超参数,一组一组的尝试,直到找到最好的组合方式。
    缺点就是计算量大,只能取固定的值,但最优的参数组合可能在方格中间, 需要不断细化取值区间,才能找到最优解,这也将指数级增大计算量

  • 随机搜索

    参数的生成方式是随机的,课搜索的空间范围更大
    缺点就是目的性不强,可能搜不到最优解

  • 遗产算法搜索

    原理是对自然界的模拟
    过程:初始化一组参数集合-> 应用到模型上进行训练-> 训练结果的准确率作为生存概率
    将生存概率高的模型的参数做组合交叉(两个模型各出一部分参数),然后产生下一代参数集合,继续训练

  • 启发式搜索

    研究热点-AutoML
    基本特点就是,使用循环神经网络来生成参数。 然后使用强化学习来进行反馈, 使用模型来训练生成参数

原文地址:https://www.cnblogs.com/sight-tech/p/13155617.html