1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同?
(1)线性回归要求因变量必须是连续性数据变量;逻辑回归要求因变量必须是分类变量,二分类或者多分类的
(2)逻辑回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。
2.自述一下什么是过拟合和欠拟合?
过拟合(OverFititing):太过贴近于训练数据的特征了,在训练集上表现非常优秀,近乎完美的预测/区分了所有的数据,但是在新的测试集上却表现平平。
欠拟合(UnderFitting):样本不够或者算法不精确,测试样本特性没有学到,不具泛化性,拿到新样本后没有办法去准确的判断
看图:
3.思考一下逻辑回归的应用场景有哪些?
(1)判断是否是垃圾邮件
(2)判断是否是金融诈骗
(3)判断是否患病
(4)预测用户是否点击特定的商品
(5)判断用户的性别