立flag

从今天起要好好复习,准备找工作。

这周六做简历。

复习内容包括:

  • 常用学习算法
    • 统计学习方法(共十一章)主要是监督学习
    • 机器学习西瓜书(1-8章为监督学习,主要可关注下第9章及以后的章节)
    • xgboost?
    • lstm?
    • lda?
    • 搜索排序的算法:pageRank, pairwise, 
    • 自然语言处理方面的入门方法: 
  • 程序+算法(数据结构)
    • 线性表(数组、链表、栈、队列)
      • 遍历、访问元素、
      • 二叉树遍历等
    • 散列表
  • hadoop&spark
    • map reduce原理
    • spark原理?
    • 二者的区别
  • 项目
    • 数据抓取与清洗:python爬虫抓取数据、规则过滤、建立品牌名、品牌官网、品牌相关词
    • 核心词提取
    • 意图提取
原文地址:https://www.cnblogs.com/wenbaoli/p/10487302.html