博文目录

为了记录自己的学习路程,特梳理目录如下:
每日学习记录
如何成为一名优秀算法工程师-1
如何成为一名优秀算法工程师-2
开源书籍
开源书籍

深度学习系列

书籍:
Neural Network and Deep Learning github https://github.com/mnielsen/neural-networks-and-deep-learning
https://zhuanlan.zhihu.com/p/58144032
在线阅读: http://neuralnetworksanddeeplearning.com/about.html
配套代码2.7 https://github.com/mnielsen/neural-networks-and-deep-learning
配套代码3.6 https://link.zhihu.com/?target=https%3A//github.com/MichalDanielDobrzanski/DeepLearningPython35

邱老师写了一个类似的,比上面的这个进阶不少
https://zhuanlan.zhihu.com/p/61591812
https://link.zhihu.com/?target=https%3A//nndl.github.io/

百面机器学习

美团机器学习实战

python using Scikit-Learn and TensorFlow.(https://github.com/ageron/handson-ml)

需不需要把机器学习算法自己都实现一遍
https://www.zhihu.com/question/36768514/answer/664241510

0527
归一化和标准化的使用场景以及归一化和标准化有没有改变数据分布
卷积层池化和激活函数的顺序
请问batch_normalization做了normalization后为什么要变回来?
为什么需要做归一化或者标准化
一个batch的数据如何做反向传播
怎么选取训练神经网络时的Batch size?
batch normalization 和激活函数的顺序问题
Batch normalization原理
batch-normalization为什么效果好
relu函数为分段线性函数,为什么会增加非线性元素
relu函数是否存在梯度消失问题以及relu函数的死亡节点问题

  1. 自然语言处理
    资源列表
    命名体识别 -lattice-lstm+crf 命名体识别系统
  1. 计算机视觉

  2. Pytorch学习
    如何自定义数据集
    如何在nlp问题中定义自己的数据集
    pytorch中词向量生成的原理
    pytorch中如何使用预训练词向量
    pytorch中torch.nn构建神经网络的不同层的含义

  3. 自己实现一个深度学习框架
    资源列表

5 pytorch实现word2vec
https://www.cnblogs.com/bamtercelboo/p/7181899.html (这个博主的github有关于文本分类的各种代码,很好)

6 中文英文文本处理代码
https://github.com/bamtercelboo/corpus_process_script

7 pytorchtorchtext 文本处理
https://cloud.tencent.com/developer/article/1168890

  • python版本实现各种简单功能

  • C/C++/Python/CUDA 实现一个简单的深度学习框框架
    卷积之后尺寸变化

  1. 深度学习框架的部署问题
  2. 深度学习系统
    陈天奇cse299
    了解/从事机器学习/深度学习系统相关的研究需要什么样的知识结构? - 张怀政的回答 - 知乎
    https://www.zhihu.com/question/315611053/answer/623529977

编程语言系列

资源列表

  1. C/C++/CUDA

  2. Python

Leetcode系列

资源列表

强化学习系列

业务代码知识系列

  1. Hadoop/Hive/mapreduce
    【Hadoop/Hive/mapreduce】系列之如何删除HIVE 表格的分区
    使用python写一个最基本的mapreduce程序
    使用shell脚本依据分区信息分批次的下载hive表格数据
    使用union all 命令之后如何对hive表格进行去重
    hive表格取差集
    hive的desc命令
    hive的load命令
    hive -show-partitions
    如何删除hive表格的分区
    如何在创建hive表格的python代码中导入外部文件
    如何在hadoop中使用外部的python程序文件-非常重要

  2. Linux/Shell

  3. 业务代码算法积累
    大规模异常滥用检测:基于局部敏感哈希算法——来自Uber Engineering的实践
    大数据下的相似度计算方法——Uber实践基于局部敏感哈希LSH
    spark中LSH算法的优化-LSH在欧式空间的应用(4)--算法实现与优化总结
    spark Word2Vec+LSH相似文本推荐(scala)

星座匹配之通过用户特征寻找相似用户
minhash算法
LSH算法

英语学习系列

机器学习系列

白板推导机器学习算法
这个系列主要是将统计学习方法以及机器学习实战结合起来,同时加上了自己对其中知识点的理解。

机器学习算法实战系列

【机器学习算法基础+实战系列】KNN算法
【机器学习算法基础+实战系列】SVM
【机器学习算法基础+实战系列】逻辑斯蒂回归
【机器学习算法基础+实战系列】决策树算法

机器学习项目系列

【机器学习项目系列】 泰坦尼克号
【机器学习项目系列】O2O优惠券核销率
【机器学习项目系列】共享单车

Sklearn系列

【Sklearn系列】使用Sklearn进行数据预处理
【Sklearn系列】KNN算法

原文地址:https://www.cnblogs.com/lzida9223/p/8347454.html