王某的NLP之路前言

感谢基友jayjay指路,其实我的方向一直比较迷茫。

因为自己是会计学出身的,前三年也没接触编程,第一次接触还是在2016年,尝试用聚宽的量化接口,当时顺便学了python 的一点知识。

后来毕业一开始一些数据分析,写一写数据分析偏财务的分析报告。

后来在亦师亦友的老常的带路下,从搭建hadoop集群到研究flume,hive等等转为大数据开发,成为一个写SQL和linux脚本的所谓大数据开发。

数仓的东西也是复杂的,无论是调度的设计还有数据分层,可是这终究不是我想要的。

一个声音一直回荡着在耳边,做算法做风控建模!

在2017年底从只知道LR和KNN等简单的机器学习,到后来慢慢尝试用一些集成算法模型XGB和LGB做一些简单的项目。

后来又因为项目原因又重新做回大数据开发,感觉离算法之路越来越远。

一开始一直以风控作为努力方向,有几点原因:

  1. 数学基础不是很好,大学中只学过4本纯数学和一本计量,毕业以后的又重新看过了一边多元统计。
  2. 本科是学财务方向的。所以最后的感觉金融与财务方向数据分析和本科专业里离得比较近,也让受聘企业容易接受非计算机科班的我。

 后来在项目上越来越发现传统的结构化数据以及依次而设计的指标根本无法满足风控的需求。经济学中,不理性判断很大的原因是信息的不充分。

那如何拥有更多更有效的信息,那么非结构化的本文与视觉数据是进一步探求的数据源。

真的勇士敢于面临未知的恐惧和未知的领域

以下开始我的NLP之路

学习路线:

贪心学院NLP为主线

高能NLP之路(基友jayjay的知乎专栏)、

龙向良的pytorch

原文地址:https://www.cnblogs.com/wqbin/p/11638843.html