《【Paper Live】滴滴出行-探索资源约束的Contextual Bandits问题 & KDD Cup滴滴出行比赛解读> p_t的解出:基于历史上已经执行过的不同的 user context 累积的收益是怎么样的 3. item rec:item的执行基于上面的资源倾斜