推荐系统 --多臂老*机

推荐系统中应用多臂老*机本质上就在寻找爆款的过程。 爆款点击多下单多。

找到点击多,且下单多的物品, 也就意味着能获得最优的收益。

简单说: 假如物品就是老*机的臂,我们想知道推荐哪个臂会得到好的收益。

那就推出去,点击几轮,看看哪个物品是爆款。然后在多推荐该物品。

可也不能一直推下去,用户是有审美疲劳的,

一般的过程,推爆款,收益先不断增大后收益下降,下降点就是重新寻找爆款的起始点

原文地址:https://www.cnblogs.com/xinping-study/p/9480995.html