Margin Loss 损失函数的设计

参考： http://blog.csdn.net/luo123n/article/details/48878759

Hinge Loss

也叫 max-margin objective 其最著名的应用是作为SVM的目标函数

其二分类情况下，公式如下：

y是预测值(-1与1之间，t是目标值+/-1)

其含义为，y的值在-1到1之间就可以了，并不鼓励 $| y | > 1$

from PRML:

The Hinge Loss E(z) = max(0,1-z) is plotted in blue, the Log Loss in red, the Square Loss in green and the misclassification error in black.

换用其他的Loss函数的话，SVM就不再是SVM了。

知乎：正是因为HingeLoss的零区域对应的正是非支持向量的普通样本，从而所有的普通样本都不参与最终超平面的决定，这才是支持向量机最大的优势所在，对训练样本数目的依赖大大减少，而且提高了训练效率。

hinge loss是一个凸函数，很多常用的凸优化技术都可以使用。不过它是不可微的，只是有subgradient

参考： http://www.cnblogs.com/ooon/p/5539687.html

SVM求解使通过建立二次规划原始问题，引入拉格朗日乘子法，然后转换成对偶的形式去求解，这是一种理论非常充实的解法。这里换一种角度来思考，在机器学习领域，一般的做法是经验风险最小化 ERM ，即构建假设函数为输入输出间的映射，然后采用损失函数来衡量模型的优劣。求得使损失最小化的模型即为最优的假设函数，采用不同的损失函数也会得到不同的机器学习算法，比如这里的主题 SVM 采用的是 Hinge Loss ，Logistic Regression 采用的则是负 $\log$

红色的线是log损失，E(x) = -log(P(Y|X))