BM25算法

      最近需要写几个的算法,做预研,深度学习压力太大了,自己一个人写还是有困难,要是用别人的开源的库,肯定很快,但是,要是出了问题,老师肯定也不会给我顶着。所以选择一个相对尺度小一点的机器学习算法写着玩吧。

      其中权重的算法textrank,但是首先要看一下bm25.做相似度计算的。

BM25算法,通常用来作搜索相关性平分。一句话概况其主要思想:对Query进行语素解析,生成语素qi;

然后,对于每个搜索结果D,计算每个语素qi与D的相关性得分,最后,将qi相对于D的相关性得分进行加权求和,从而得到Query与D的相关性得分。

睡觉。

原文地址:https://www.cnblogs.com/hgonlywj/p/4906074.html