李宏毅classification+Logistic Regression(lecturte4+5)课堂笔记

穷举最好函数最基本方法结合贝叶斯公式、全概率公式,算概率 

简单例子:

红圈里根据数据算出 。

极大似然估计:

某个μ和∑的Gaussian就是每个样本点的几率

穷举所有μ和∑,能使likelihood 式子最大的μ和∑我们就认为它们是最有可能产生那79个点的μ*和∑*。易知μ*和∑*的最佳解。

每个类总用不同的μ和∑,可能会效果不好或者过拟合,选择使用同一个∑

 采用此方法分类结果

回顾总结几率模型 :

补充:

具体看z,

最后就有

推导过程了解就好,要知道实际上求那么多μ1和μ2,N1和N2都是为了找w和b,怎样能更简洁的找w和b呢?

-----

-------

最后miniaturize的函数就是

最后推导有

对比:

 Multi-class Classification:

引入深度学习和神经网络,可以再看一遍

  

原文地址:https://www.cnblogs.com/lunotebook/p/11412639.html