深度学习扫盲笔记

深度学习扫盲笔记

第一章：概述

深度学习：机器学习含有多个隐藏层

有监督的：卷积，循环，递归

无监督的：生成式

类别标签：

ground truth：表示直接收集到的数据

使用sklearn进行训练集，测试集的拆分：留出法和k折交叉验证，分层抽样策略

超参数：不变的，调节超参数找到能使模型取得较好性能的超参数

第二章：特征工程

目的是最大限度地从原始数据中提取特征以供算法和模型使用

1：概述

自然语言处理：自动分词，词性标注，句法分析

Text Process API：情感分析

Jieba：中文语言处理

2：向量空间模型及文本相似度计算

BOW假设（存在模型）VSM模型（向量空间模型）

3：特征处理

特征缩放

标准化：方程和标准差

特征选择

特征降维

第三章：回归问题及正则化

1：线性回归

梯度下降法

沿着损失函数梯度下降的方向，寻找损失函数的最小值，得到最优解

2：多元回归

西瓜的价格取决于多种因素

3：损失函数的正则化

抑制过拟合

4：逻辑回归

使用sigmoid函数

垃圾短信分类

第四章：信息熵及梯度计算

1：熵

2：反向传播（BP）与梯度

从输出节点开始，将误差信号沿着原来的连接通路返回，通过修改各层神经元的连接权值，使误差信号减至最小。

3：感知机

第五章：循环神经网络（RNN）

1：概念

隐藏层节点之间是有连接的，考虑上下文内容

RNN序列处理

2：长短时记忆网络（LSTM）

标准的无法捕捉长期状态

3：双向RNN，注意力模型

双向RNN

注意力模型：集中到重要

第六章：卷积与卷积网络

卷积使原始信号的特征被增强

对图像和滤波矩阵做内积的操作叫做卷积操作

卷积神经网络：特点

1：局部连接

局部相关性较高

局部连接，参数共享，子采样

2：参数共享

卷积核中是相同的，

3：多卷积核

也可以使用不同大小，不同数值的卷积核

4：池化处理

降采样处理，对不同位置的特征进行聚合统计，通常去对应位置的最大值（最大池化）平均值

LeNet-5

第七章：递归神经网络:

1：情感分析

（意见挖掘，倾向性分析）是对带有情感色彩的主观性文本进行分析，处理

现有的情感词典

生语料

2：词向量

3：递归神经网络

引入了张量层

第八章：生成式神经网络

1：自动编码器

无监督学习：聚类，自动编码器是一种无监督的神经网络模型

2：变分自动编码器

3：生成对抗网络

仿制者与鉴定师对抗，对抗时越来越强

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/nullering/p/12939089.html