2014知识补全计划

很幸运,我有一个开明的老大,跨年那天的抱怨文章转给他看之后便得到了尝试做纯数据工作的机会。

截止今天,看完了2本自认为很有用的入门读物《数据挖掘导论》《统计学》,学习了两个软件orange与spss,完成了三篇对公司业务情况的专题研究(游戏用户聚类;游戏大户预测;电商优惠信息发布策略),对了,年后还去了趟加州......

作为半路出家的data engineer,自然关注了一批奋战在一线的数据工作者。看完他们的博客,真的会对数据肃然起敬,知其然而不知其所以然的话,可能连自己都没法说服更不用说要让老板和业务方信服了。对自己和这些硕士博士的差距深感焦虑的同时,理所当然地,定下了14年的目标——补全基础知识:

1.试验设计:怎样设计试验,怎样分析试验结论,看似简单的对比试验背后其实有很多复杂的统计模型,作为数据团队需要给出谨慎科学的试验结论以辅助决策。

2.统计模型:除了一般线性回归模型外还有时间序列等。

3.随机过程:还没有仔细研究过,不过系统仿真是以后一定会用到的方法,随机过程在仿真中占据着重要的地位。

4.高等数学与线性代数:基础中的基础,本来可以lazy load,但是像svm这种算法如果你数学基础不够,根本看不懂它在说什么,还是老老实实夯实基础吧!

5.斯坦福机器学习课程cs229:太爱网易公开课了,提供了课程讲义的下载,我会把自己当成斯坦福的学生来学这个课程,去推导每一个算法的公式。

6.终极目标:能够自己设计并实现算法。

虽然现在流行敏捷开发,敏捷学习,但是敏捷的最后很可能是花费更多的总时间。而这次目标的时间期限是一年,所以还是采用步步为营的策略:4月学完试验设计;5月消化统计模型;6月学习随机过程;三个月期间穿插复习完高等数学与线性代数;7月开始正式进入到cs229的学习当中;预计10月/11月开始尝试算法的实现。

2015年,会让人刮目相看的!

原文地址:https://www.cnblogs.com/logosxxw/p/14400405.html