10-少年,玩模型吗?手把手教你statsmodels建模(1)

群主是呆在舒适区的典型例子,大学时曾有一个数学建模竞赛,我不太明白模型是什么,于是错过了。另一个班上的同学勇敢地参加了,还从图书馆借了一堆书暑假回去学习,功夫不负有心人,他后来获得了全国二等奖的好成绩。可见对未知的恐惧会羁绊人进步的步伐。

那么模型到底是什么呢?经过多年数据分析工作的洗礼,我得出一个不成熟的结论:模型,就是把现实世界中发生的事情映射到数学世界,从而发现普适性的规律。俄国物理学家Kitaigorodski说过:”一流的理论作预测,二流的理论下禁令,三流的理论进行事后的解释“。套用到数据建模上面,有的模型可以对未来做预测(如销售预测),有的模型告诉我们什么不应该做(如漏斗模型中影响转化率的薄弱环节),有的模型对已发生的现象做描述(如客户聚类)。

千里之行始于足下,让我们迈开勇敢的第一步,先从基础的统计学知识开始学起!

1统计学基础

1)描述性统计学

2)随机数

3)概率分布

在stats包中有许多分布,比如正态分布,F分布,泊松分布等。

关于各种常见分布的定义可参考:

http://shujuren.org/article/104.html

本周主要找找统计学的感觉,下周我们来撩一撩统计学的金线:假设检验。前路越坎坷,风景越迷人。敬请期待!

原文地址:https://www.cnblogs.com/turingbrain/p/7078201.html