图文相关性 flickr数据实验结论_1

  1. 初始化的选取很重要,random_uniform的效果远远好于random_normal, 是否有bias对效果影响很小

   

红色是random_uniform初始化,对比random_normal初始化的蓝色, 曲线表示ndcg@1

   

  1. 文本端使用更复杂的建模能够提升效果特别针对flickr长序列数据,对应短关键词数据效果没有这么明显

    实验表明逆向lstm,采用向量累加表示文本效果好于正向lstm

    lstm相对收敛慢但是后来居上 多次迭代后效果超过bow模型

    红色bow模型,蓝色rnn模型

    值得注意的是 相对bow模型 rnn trainloss 下降要慢很多 但是测试集合效果要好, metric结果多轮之后也明显变好,top1的准确率(召回)可以达到约12%

原文地址:https://www.cnblogs.com/rocketfan/p/6186726.html