【点击模型学习笔记】Inferring clickthrough rates on ads from click behavior on search results_wsdm2011

概要:
看这篇文章的初衷,是这篇文章回答了问题“在一个query的结果其中,给出多少个广告位合适?”。

文章不长。只是一路看下来,发现貌似不是native-english-speaker写的,细节说的不清晰。全然无法还原作者的工作思路。

只是还是有那么一点儿收获的。


详细内容:

搜索基本的赚钱方式是在搜索结果其中嵌入广告,一般来讲是依照广告的点击次数来付费的。这样。就有一个趋势。假设想要赚钱多,就在搜索结果中越来越多的植入广告,使得广告的点击次数越来越多。则赚的钱就越来越多。只是,也有研究表明,假设植入的广告越多,则搜索结果的质量下降,用户对搜索结果的总体点击率也会下降,则用户对广告的点击也会下降。

本文的目标就是找到一种“平衡点”。在不影响搜索质量的前提下,广告的点击率最大。

本文的优化目标就是广告的点击率。

作者看数据,发现假设搜索结果的top结果点击率比較低,则放几个广告上去是比較适合的。从实际情景上来看,用户的搜索目的并不十分明白,则比較easy点击广告。进一步的(个人想法),怎样推断这样的情况?对于每一个query。用户的点击分布。计算熵,假设熵值比較大。则点击比較‘均匀’,则适合广告投放。


query,依据广告主是否买了这个query中的term,和query返回的结果其中是否有广告数据,分为commercial query和non-commercial query。

在实验数据上,作者证实了搜索结果点击和广告点击的相关性。

证实的方法,貌似是对搜索结果进行区域划分,每一个区域作为一个bin,计算bin上面的熵。搜索结果上面的计算结果和广告上的计算结果的大小增长趋势是一致的,就觉得是相关的了。


怎样确定搜索结果里面投放的广告个数?
作者对这个问题做了简化。两种选择:或者投放一个广告,或者投放三个广告。

总体要优化的是用户总点击次数。对这两种情况进行加权。

用LR等模型进行学习。

——说实话。没看懂作者的加权后的目标函数。

作者似乎也不是针对每一个query,来确定究竟实现是一个广告还是三个广告。貌似统一的做一个权重。如:对全部query,显示1.5个广告?
文章写的非常不清晰。

原文地址:https://www.cnblogs.com/mqxnongmin/p/10804851.html