逻辑回归——多类别分类

多分类问题

  • 将邮件分为不同类别/标签:工作(y=1),朋友(y=2),家庭(y=3),爱好(y=4)
  • 天气分类:晴天(y=1),多云天(y=2),下雨天(y=3),下雪天(y=4)
  • 医学图示(Medical diagrams):没生病(y=1),感冒(y=2),流感(y=3)

二分类问题的示意图如下

多分类问题如下

One-vs-all(one-vs-rest)

生成三个假的数据集

定义一个函数

[h_ heta ^{left( { m{1}} ight)}left( x ight) = Pleft( {y = 1|x; heta } ight)]

处理过的数据集就是二分类问题,通过逻辑回归可能得到红线区分不同类别

同理

定义函数

[h_ heta ^{left( { m{2}} ight)}left( x ight) = Pleft( {y = 2|x; heta } ight)]

定义函数

[h_ heta ^{left( { m{3}} ight)}left( x ight) = Pleft( {y = 3|x; heta } ight)]

总结公式

[h_ heta ^{left( { m{i}} ight)}left( x ight) = Pleft( {y = i|x; heta } ight)]


当需要预测新的数据的类别时,使用如下公式

[mathop {max }limits_i h_ heta ^{left( { m{i}} ight)}left( x ight)]

也就是使用不同的函数去预测输入x,分别计算不同h(x)的值,然后取其中的最大值。哪个i对应的h(x)越大,就认为属于哪个类。

原文地址:https://www.cnblogs.com/qkloveslife/p/9858483.html