系统的机器学习课程

连接中部分书价格太贵没有购买，找到电子版，在淘宝上打印成书
https://cloud.tencent.com/developer/article/1540204
https://cloud.tencent.com/developer/article/1537877
https://cloud.tencent.com/developer/article/1537831
ESL、MLAPP、PRML
ISL
清华姚班的课程：
高等数学
线性代数
计算机专业导论
Python语言编程
计算机思维导论
计算机科学与Python编程导论
计算机科学中的数学
C语言程序设计
概率论与数理统计
离散数学
抽象代数
C++语言程序设计
数据结构
计算机系统基础
数值分析
计算机组成原理
算法分析与设计
理论计算机科学基础
密码学原理
信息安全概论
网络与市场中的计算思维
博弈论
计算思维与数据科学导论
编译原理
数据库系统概论
Java程序设计
人工智能原理
计算机网络
大数据算法
操作系统
软件工程
机器学习
大数据技术原理与应用
计算机图形学
信息论与编码理论
区块连技术与应用
计算机入门
计算机应用数学
程序设计与算法基础
算法设计
计算理论
网络科学
密码学基础
博弈论
计算机安全的理论与实践
量子信息
机器学习
高等计算机图形学
操作系统
分布式计算
机器学习与模式识别
信息论与网络编码
计算生物学
专题训练实践
计算机科学研究实践
人类和机器的语音交流

| 自己梳理| 进度| 网络课程| 进度 |备注
| :---- | :----|:---- | :----|:---- | :----|
| 1、经典算法梳理和学习 | | 第一阶段算法与机器学习基础 | |
| 1.1 统计学习方法|看完一遍 | 【核心知识点】 | |
| 1.2 西瓜书（半监督学习、概率图模型、强化学习、规则学习） | | . 时间复杂度，空间复杂度分析 | |
| 1.3 深水区攻坚 | | . Master's Theorem，递归复杂度分析 | |
| 1.4 Andrew NG 机器学习课程 | | . 动态规划以及Dynamic Time Warpping | |
| 1.5 Andrew NG 深度学习系列课程 | | . Earth Mover's Distance | |
| 1.6 Sequence learning | | . 维特比算法 | |
| | | . LR、决策树、随机森林、XGBoost | |
| | | . 梯度下降法、随机梯度下降法、牛顿法 | |
| | | . Projected Gradient Descent | |
| 2、自然语言和推荐系统 | | . L0, L1, L2, L-Infinity Norm | |
| 2.1 数学之美（进行中） | | . Grid Search, Bayesian Optimization | |
| 2.2 统计自然语言处理 | | . 凸函数、凸集、Duality、KKT条件 | |
| 2.3 这就是推荐引擎系统 | | . Linear SVM、Dual of SVM | |
| 2.4 谷歌搜索引擎 | | . Kernel Tick, Mercer's Theorem | |
| 2.5 推荐系统汇总资料：https://www.cnblogs.com/DjangoBlog/p/11474477.html | | . Kernelized Linear Regression、Kernelized KNN | |
| | | . Linear/Quadratic Programming | |
| | | . Integer/Semi-definite Programming | |
| | | . NP-completeness/NP-hard/P/NP | |
| 3、深度学习基础内容 | | . Constrained Relaxation、Approximate Algorithm | |
| 3.1 花书（2019/11/19重新开始） | | . Convergence Analysis of Iterative Algorithm | |
| 3.2 花书配套的实战书 | | | |
| 3.3 经典论文 | | 【部分案例讲解】 | |
| 3.4 李弘毅深度学习课程（暂停） | | . 基于Sparse Quadratic Programming的股票投资组合优化策略编写 | |
| 3.5 https://blog.csdn.net/abc13526222160/article/details/84099863 | | . 基于Earth Mover's Distance的短文本相似度计算 | |
| | | . 基于Projected Gradient Descent和非负矩阵分解的词向量学习 | |
| | | . 基于Linear Programming的机票定价系统 | |
| | | . 基于DTW的文本相似度分析 | |
| 4、Java实现Lightgbm、线上代码梳理、其他实时算法（10/8~11/31） | | | |
| | | 第二阶段语言模型与序列标注 | |
| 5、机器学习内容查全补漏 | | | |
| 5.1 Leetcode（进行中，重点） | | 【核心知识点】 | |
| 5.2 百面机器学习（暂停） | | . 文本预处理技术（tf-idf，Stemming等） | |
| 5.3 刘建平博客（12月2号完成，剩余强化学习章节19/135） | | . 文本领域的特征工程 | |
| 5.4 https://www.cnblogs.com/DjangoBlog/p/9131224.html 博客 | | . 倒排表、信息检索技术 | |
| 5.5 机器学习AI算法工程 | | . Noisy Channel Model | |
| | | . N-gram模型，词向量介绍 | |
| | | . 常见的Smoothing Techniques | |
| | | . Learning to Rank | |
| 5.6 遗留问题： | | . Latent Variable Model | |
| | | . EM算法与Local Optimality | |
| RNN在BP过程中梯度消失的原因，链式求导过程 | | . Convergence of EM | |
| end-to-end-learning | | . EM与K-Means, GMM | |
| Batch Normalization | | . Variational Autoencoder与Text Disentangling | |
| AutoEncoder | | .有向图与无向图模型 | |
| Denoising AutoEncoder：在训练数据中加入噪声，需学习去除这种噪声 | | . Conditional Indepence、D-separ
| Sparse Coding 系数编码 | | . HMM模型以及参数估计 | |
| FFM 和 DeepFFM的代码 | | . Viterbi、Baum Welch | |
| GBDT + LR代码 | | . Log-Linear Model与参数估计 | |
| 不同分布函数参数的估计（有偏和无偏估计） | | . CRF模型与Linear-CRF | |
| 变分推断 | | . CRF的Viterbi Decoding与参数估计 | |
| 估计量的一致性 | | | |
| 线性回归最大似然 | | | |
| 频率派和贝叶斯派在参数估计上的差异 | | 【部分案例讲解】 | |
| 贝叶斯参数优化 | | . 基于无监督学习方法的问答系统搭建 | |
| 贝叶斯线性回归 | | . 基于监督学习的Aspect-Based 情感分析系统搭建 | |
| 正则化与MAP贝叶斯推断（L2相当于权重是高斯先验的MAP贝叶斯推断；L1与通过AMP贝叶斯推断最大化的对数先验项是等价的） | | . 基于CRF、LSTM-CRF、BERT-CRF 的命名实体识别应用 | |
| 基于RBM的推荐系统（流行于2016年左右） | | . 基于语言模型和Noisy Channel Model的拼写纠错 | |
| | | | |
| 系统的看一遍别人写的推荐系统都使用了哪些具体算法以及推荐系统的发展现状 | | 第三阶段信息抽取、词向量与知识图谱 | |
| | | | |
| 用PMML实现机器学习模型的跨平台上线:https://www.cnblogs.com/pinard/p/9220199.html（等有一定的java基础后再去实践） | | | |
| tensorflow机器学习模型的跨平台上线:https://www.cnblogs.com/pinard/p/9251296.html （等有一定的java基础后再去实践） | | 【核心知识点】 | |
| 小小挖掘机：https://cloud.tencent.com/developer/column/2381 | | . 命名实体识别技术 | |
| 算法channel：https://cloud.tencent.com/developer/user/1478933 | | . 信息抽取技术 | |
| 迹函数贝叶斯的条件概率估计：频率主义学派、贝叶斯学派L2和L1正则化的异同胶囊神经网络 | | . Snowball, KnowitAll, RunnerText | |
| | | . Distant Supervision, 无监督学习方法 | |
| 6、11/1~12/31数学基础 | | . 实体统一、实体消歧义、指代消解 | |
| 6.1 高等数学 | | . 知识图谱、实体与关系 | |
| 6.2 离散数学 | | . 词向量、Skip-Gram、Negative Sampling | |
| 6.3 概率论与数理统计：陈希儒 | | . 矩阵分解、CBOW与Glove向量 | |
| 6.4 抽象数学 | | . Contexualized Embedding与ELMo | |
| 6.5 矩阵论 | | . KL Divergence与Gaussian Embedding | |
| 6.6 运筹学 | | . 非欧式空间与Pointcare Embedding | |
| 6.7 线性代数（完成） | | . 黎曼空间中的梯度下降法 | |
| 6.8 统计学 | | . 知识图谱嵌入技术 | |
| 6.9 图论 | | . TransE, NTN 的详解 | |
| 6.10 矩阵分析与应用：张贤达 | | . Node2Vec详解 | |
| 7、11/1~12/31计算机类课程 | | . Adversial Learning与KBGAN | |
| 7.1 数据结构 | | | |
| 7.2 Java | | | |
| 7.3 虽然用了挺长事件的Python，但是并未完整的学过某种编程算法，代码写起来还是比较吃力，坚持写一段时间的代码，多看看多写写 | | 【部分案例讲解】 | |
| 8、是时候准备开始健身了，保持一个良好的形态（预计2020年1月1号开始） | | . 利用非结构化数据和信息抽取技术构建知识图谱 | |
||| . 任务导向型聊天机器人的搭建
||| . 包含Intent与Entity Extraction的NLU模块实现
||| . 基于SkipGram的推荐系统实现（参考Airbnb论文）
|||
|||
||| 第四阶段深度学习与NLP
|||
|||
||| 【核心知识点】
||| . Pytorch与Tensorflow详解. 表示学习，分布式表示技术
||| . 文本领域中的Disentangling
||| . 深度神经网络与BP算法详解
||| . RNN与Vanishing/Exploding Gradient
||| . LSTM与GRU
||| . Seq2Seq与注意力机制
||| . Greedy Decoding与Beam Search
||| . BI-LSTM-CRF模型
||| . Neural Turing Machine
||| . Memory Network
||| . Self Attention，Transformer以及Transformer-XL.
||| . Bert的详解
||| . BERT-BiLSTM-CRF
||| . GPT，MASS, XLNet
||| . Low-resource learning
||| . 深度学习的可视化
||| . Laywer-wise Relevance Propagation
|||
||| 【部分案例讲解】
||| . 利用纯Python实现BP算法
||| . 基于Seq2Seq+注意力机制、基于Transformer的机器翻译系统
||| . 基于Transformer的闲聊型聊天机器人
||| . 基于BI-LSTM-CRF和BERT-BiLSTM-CRF在命名实体中的比较
||| . 利用Laywer-wise RP可视化端到端的机器翻译系统
|||
||| 第五阶段贝叶斯模型与NLP
|||
|||
||| 【核心知识点】
||| . 概率图模型与条件独立
||| . Markov Blanket
||| . Dirichlet分布、Multinomial分布
||| . Beta分布、Conjugate Prior回顾
||| . Detail Balance
||| . 主题模型详解
||| . MCMC与吉布斯采样
||| . 主题模型与Collapsed Gibbs Sampling
||| . Metropolis Hasting, Rejection Sampling
||| . Langevin Dyamics与SGLD
||| . 分布式SGLD与主题模型
||| . Dynamic Topic Model
||| . Supervised Topic Model
||| . KL Divergence与ELBO
||| . Variantional Inference, Stochastic VI
||| . 主题模型与变分法
||| . Nonparametric Models
||| . Dirichlet Process
||| . Chinese Restarant Process
||| . Bayesian Deep Neural Network
||| . VAE与Reparametrization trick
||| . Bayesian RNN/LSTM
||| . Bayesian Word2Vec
||| . MMSB
|||
|||
||| 【部分案例讲解】
||| . 利用Collapsed Gibbs Sampler和SGLD对主题模型做Inference
||| . 基于Bayesian-LSTM的命名实体识别
||| . 利用主题模型做文本分类在
||| . LDA的基础上修改并搭建无监督情感分析模型
|||
||| 第六阶段开放式项目（Optional）
|||
|||
||| 【项目介绍】
||| 开放式项目又称为课程的capstone项目。作为课程中的很重要的一部分，可以选择work on一个具有挑战性的项目。通过此项目，可以深入去理解某一个特定领域，快速成为这个领域内的专家，并且让项目成果成为简历中的一个亮点。
|||
||| 【项目流程】
||| Step 1: 组队
||| Step 2：立项以及提交proposal
||| Step 3: Short Survey Paper
||| Step 4: 中期项目Review
||| Step 5: 最终项目PPT以及代码提交
||| Step 6: 最终presentation
||| Step 7: Technical Report/博客
|||
||| 【输出结果】
||| 完整PPT、代码和Conference-Style Technical Report 最为项目的最后阶段，我们将组织学员的presentation分享大会。借此我们会邀请一些同行业的专家、从业者、企业招聘方、优质猎头资源等共同参与分享大会。
|||
|||
|||
||| 问答系统
||| 从零开始搭建一个完整的问答系统。给定一个语料库（问题和答案对），对于用户的输入需要返回最适合的答案。涉及到的模块：
||| 1. 对于用户的输入需要做拼写纠错，这部分会用到语言模型
||| 2. 之后对输入做文本的预处理，过滤等操作。
||| 3. 把文本转换成向量形式，这里需要用到tf-idf, word2vec等相关的技术。
||| 4. 针对于语料库，为了提升效率需要创建倒排表。
||| 5. 基于相似度的计算来获得最优的答案。
|||
||| 情感分析系统
||| 基于给定数据，来搭建一个完整的情感分析系统。项目涉及到的模块：
||| 1. 数据的预处理
||| 2. 特征工程，这部分是本项目的核心。
||| 3. 监督学习模型的选择与调参。调参的过程需要尝试不同的优化策略。
|||
||| 知识图谱系统
||| 利用非结构化数据来搭建知识图谱。项目涉及到的模块：
||| 1. 从非结构化数据中抽取实体，以及词典库的构建
||| 2. 关系的抽取（指定的关系）
||| 3. 实体统一以及实体消歧。
||| 4. 知识图谱的构建以及查询
|||
||| 对话系统中的NLU
||| 基于给定的对话数据来构建NLU识别部分，并结果用于聊天机器人中。项目涉及到的模块：
||| 1. 文本特征的提取
||| 2. 搭建CRF模型来识别关键词
||| 3. 搭建LSTM-CRF模型来识别关键词。
|||
||| 机器翻译系统
||| 基于给定数据，来搭建一个完整的情感分析系统。项目涉及到的模块：
||| 1. 数据的预处理
||| 2. 特征工程，这部分是本项目的核心。
||| 3. 监督学习模型的选择与调参。调参的过程需要尝试不同的优化策略。
|||
|||
||| 任务导向型聊天机器人
||| 搭建一个完整的聊天机器人，用来服务搜索餐厅。项目涉及到的模块：
||| 1. 文本预处理
||| 2. 意图识别和关键信息抽取
||| 3. 对于每一个意图设计对话管理状态机
||| 4. 设计上下文处理的方法
||| 5. 对话生成模块
||| 6. 处理一些常见的boundary case。

1、经典算法梳理和学习
1.1 统计学习方法（无监督学习概论、聚类方法、奇异值分解、主成分分析、潜在语义分析、概率潜在语义分析、MCMC、LDA、PageRank）
1.2 西瓜书（半监督学习、概率图模型、强化学习、规则学习）
1.3 深水区攻坚
1.4 Andrew NG 机器学习课程
1.5 Andrew NG 深度学习系列课程
1.6 Sequence learning

2、自然语言和推荐系统
2.1 数学之美（进行中）
2.2 统计自然语言处理
2.3 这就是推荐引擎系统
2.4 谷歌搜索引擎
2.5 推荐系统汇总资料：https://www.cnblogs.com/DjangoBlog/p/11474477.html

3、深度学习基础内容
3.1 花书（2019/11/19重新开始）
3.2 花书配套的实战书
3.3 经典论文
3.4 李弘毅深度学习课程（暂停）
3.5 https://blog.csdn.net/abc13526222160/article/details/84099863

4、Java实现Lightgbm、线上代码梳理、其他实时算法（10/8~11/31）

5、机器学习内容查全补漏
5.1 Leetcode（进行中，重点）
5.2 百面机器学习（暂停）
5.3 刘建平博客（12月2号完成，剩余强化学习章节19/135）
5.4 https://www.cnblogs.com/DjangoBlog/p/9131224.html 博客
5.5 机器学习AI算法工程

5.6 遗留问题：

RNN在BP过程中梯度消失的原因，链式求导过程
end-to-end-learning
Batch Normalization
AutoEncoder
Denoising AutoEncoder：在训练数据中加入噪声，需学习去除这种噪声
Sparse Coding 系数编码
FFM 和 DeepFFM的代码
GBDT + LR代码
不同分布函数参数的估计（有偏和无偏估计）
变分推断
估计量的一致性
线性回归最大似然
频率派和贝叶斯派在参数估计上的差异
贝叶斯参数优化
贝叶斯线性回归
正则化与MAP贝叶斯推断（L2相当于权重是高斯先验的MAP贝叶斯推断；L1与通过AMP贝叶斯推断最大化的对数先验项是等价的）
基于RBM的推荐系统（流行于2016年左右）

系统的看一遍别人写的推荐系统都使用了哪些具体算法以及推荐系统的发展现状

用PMML实现机器学习模型的跨平台上线:https://www.cnblogs.com/pinard/p/9220199.html（等有一定的java基础后再去实践）
tensorflow机器学习模型的跨平台上线:https://www.cnblogs.com/pinard/p/9251296.html （等有一定的java基础后再去实践）
小小挖掘机：https://cloud.tencent.com/developer/column/2381
算法channel：https://cloud.tencent.com/developer/user/1478933
迹函数贝叶斯的条件概率估计：频率主义学派、贝叶斯学派L2和L1正则化的异同胶囊神经网络

6、11/1~12/31数学基础
6.1 高等数学
6.2 离散数学
6.3 概率论与数理统计：陈希儒
6.4 抽象数学
6.5 矩阵论
6.6 运筹学
6.7 线性代数（完成）
6.8 统计学
6.9 图论
6.10 矩阵分析与应用：张贤达
6.11 信息论基础
6.12 凸优化：鲍信

7、11/1~12/31计算机类课程

7.1 数据结构
7.2 Java
7.3 虽然用了挺长事件的Python，但是并未完整的学过某种编程算法，代码写起来还是比较吃力，坚持写一段时间的代码，多看看多写写

8、是时候准备开始健身了，保持一个良好的形态（预计2020年1月1号开始）

公众号上抄下来的，希望自己将知识点学习一遍后再回头梳理这些内容，做为自己学习的一个指导

第一阶段算法与机器学习基础
【核心知识点】
. 时间复杂度，空间复杂度分析
. Master's Theorem，递归复杂度分析
. 动态规划以及Dynamic Time Warpping
. Earth Mover's Distance
. 维特比算法
. LR、决策树、随机森林、XGBoost
. 梯度下降法、随机梯度下降法、牛顿法
. Projected Gradient Descent
. L0, L1, L2, L-Infinity Norm
. Grid Search, Bayesian Optimization
. 凸函数、凸集、Duality、KKT条件
. Linear SVM、Dual of SVM
. Kernel Tick, Mercer's Theorem
. Kernelized Linear Regression、Kernelized KNN
. Linear/Quadratic Programming
. Integer/Semi-definite Programming
. NP-completeness/NP-hard/P/NP
. Constrained Relaxation、Approximate Algorithm
. Convergence Analysis of Iterative Algorithm

【部分案例讲解】
. 基于Sparse Quadratic Programming的股票投资组合优化策略编写
. 基于Earth Mover's Distance的短文本相似度计算
. 基于Projected Gradient Descent和非负矩阵分解的词向量学习
. 基于Linear Programming的机票定价系统
. 基于DTW的文本相似度分析

第二阶段语言模型与序列标注

【核心知识点】
. 文本预处理技术（tf-idf，Stemming等）
. 文本领域的特征工程
. 倒排表、信息检索技术
. Noisy Channel Model
. N-gram模型，词向量介绍
. 常见的Smoothing Techniques
. Learning to Rank
. Latent Variable Model
. EM算法与Local Optimality
. Convergence of EM
. EM与K-Means, GMM
. Variational Autoencoder与Text Disentangling
.有向图与无向图模型
. Conditional Indepence、D-separation、Markov Blanket
. HMM模型以及参数估计
. Viterbi、Baum Welch
. Log-Linear Model与参数估计
. CRF模型与Linear-CRF
. CRF的Viterbi Decoding与参数估计

【部分案例讲解】
. 基于无监督学习方法的问答系统搭建
. 基于监督学习的Aspect-Based 情感分析系统搭建
. 基于CRF、LSTM-CRF、BERT-CRF 的命名实体识别应用
. 基于语言模型和Noisy Channel Model的拼写纠错

第三阶段信息抽取、词向量与知识图谱

【核心知识点】
. 命名实体识别技术
. 信息抽取技术
. Snowball, KnowitAll, RunnerText
. Distant Supervision, 无监督学习方法
. 实体统一、实体消歧义、指代消解
. 知识图谱、实体与关系
. 词向量、Skip-Gram、Negative Sampling
. 矩阵分解、CBOW与Glove向量
. Contexualized Embedding与ELMo
. KL Divergence与Gaussian Embedding
. 非欧式空间与Pointcare Embedding
. 黎曼空间中的梯度下降法
. 知识图谱嵌入技术
. TransE, NTN 的详解
. Node2Vec详解
. Adversial Learning与KBGAN

【部分案例讲解】
. 利用非结构化数据和信息抽取技术构建知识图谱
. 任务导向型聊天机器人的搭建
. 包含Intent与Entity Extraction的NLU模块实现
. 基于SkipGram的推荐系统实现（参考Airbnb论文）

第四阶段深度学习与NLP

【核心知识点】
. Pytorch与Tensorflow详解. 表示学习，分布式表示技术
. 文本领域中的Disentangling
. 深度神经网络与BP算法详解
. RNN与Vanishing/Exploding Gradient
. LSTM与GRU
. Seq2Seq与注意力机制
. Greedy Decoding与Beam Search
. BI-LSTM-CRF模型
. Neural Turing Machine
. Memory Network
. Self Attention，Transformer以及Transformer-XL.
. Bert的详解
. BERT-BiLSTM-CRF
. GPT，MASS, XLNet
. Low-resource learning
. 深度学习的可视化
. Laywer-wise Relevance Propagation

【部分案例讲解】
. 利用纯Python实现BP算法
. 基于Seq2Seq+注意力机制、基于Transformer的机器翻译系统
. 基于Transformer的闲聊型聊天机器人
. 基于BI-LSTM-CRF和BERT-BiLSTM-CRF在命名实体中的比较
. 利用Laywer-wise RP可视化端到端的机器翻译系统

第五阶段贝叶斯模型与NLP

【核心知识点】
. 概率图模型与条件独立
. Markov Blanket
. Dirichlet分布、Multinomial分布
. Beta分布、Conjugate Prior回顾
. Detail Balance
. 主题模型详解
. MCMC与吉布斯采样
. 主题模型与Collapsed Gibbs Sampling
. Metropolis Hasting, Rejection Sampling
. Langevin Dyamics与SGLD
. 分布式SGLD与主题模型
. Dynamic Topic Model
. Supervised Topic Model
. KL Divergence与ELBO
. Variantional Inference, Stochastic VI
. 主题模型与变分法
. Nonparametric Models
. Dirichlet Process
. Chinese Restarant Process
. Bayesian Deep Neural Network
. VAE与Reparametrization trick
. Bayesian RNN/LSTM
. Bayesian Word2Vec
. MMSB

【部分案例讲解】
. 利用Collapsed Gibbs Sampler和SGLD对主题模型做Inference
. 基于Bayesian-LSTM的命名实体识别
. 利用主题模型做文本分类在
. LDA的基础上修改并搭建无监督情感分析模型

第六阶段开放式项目（Optional）

【项目介绍】
开放式项目又称为课程的capstone项目。作为课程中的很重要的一部分，可以选择work on一个具有挑战性的项目。通过此项目，可以深入去理解某一个特定领域，快速成为这个领域内的专家，并且让项目成果成为简历中的一个亮点。

【项目流程】
Step 1: 组队
Step 2：立项以及提交proposal
Step 3: Short Survey Paper
Step 4: 中期项目Review
Step 5: 最终项目PPT以及代码提交
Step 6: 最终presentation
Step 7: Technical Report/博客

【输出结果】
完整PPT、代码和Conference-Style Technical Report 最为项目的最后阶段，我们将组织学员的presentation分享大会。借此我们会邀请一些同行业的专家、从业者、企业招聘方、优质猎头资源等共同参与分享大会。

问答系统
从零开始搭建一个完整的问答系统。给定一个语料库（问题和答案对），对于用户的输入需要返回最适合的答案。涉及到的模块：

对于用户的输入需要做拼写纠错，这部分会用到语言模型
之后对输入做文本的预处理，过滤等操作。
把文本转换成向量形式，这里需要用到tf-idf, word2vec等相关的技术。
针对于语料库，为了提升效率需要创建倒排表。
基于相似度的计算来获得最优的答案。

情感分析系统
基于给定数据，来搭建一个完整的情感分析系统。项目涉及到的模块：

数据的预处理
特征工程，这部分是本项目的核心。
监督学习模型的选择与调参。调参的过程需要尝试不同的优化策略。

知识图谱系统
利用非结构化数据来搭建知识图谱。项目涉及到的模块：

从非结构化数据中抽取实体，以及词典库的构建
关系的抽取（指定的关系）
实体统一以及实体消歧。
知识图谱的构建以及查询

对话系统中的NLU
基于给定的对话数据来构建NLU识别部分，并结果用于聊天机器人中。项目涉及到的模块：

文本特征的提取
搭建CRF模型来识别关键词
搭建LSTM-CRF模型来识别关键词。

机器翻译系统
基于给定数据，来搭建一个完整的情感分析系统。项目涉及到的模块：

数据的预处理
特征工程，这部分是本项目的核心。
监督学习模型的选择与调参。调参的过程需要尝试不同的优化策略。

任务导向型聊天机器人
搭建一个完整的聊天机器人，用来服务搜索餐厅。项目涉及到的模块：

文本预处理
意图识别和关键信息抽取
对于每一个意图设计对话管理状态机
设计上下文处理的方法
对话生成模块
处理一些常见的boundary case。