长尾分布paper阅读记录

分类:
1.Test-Agnostic Long-Tailed Recognition by Test-Time Aggregating Diverse Experts with Self-Supervision
url:https://arxiv.org/pdf/2107.09249.pdf
大家都开始整模型融合了,说明多样性+合适的融合方式确实在长尾上很有用。作者说自己的motivation是,test distribution其实有各种各样分布,所以可以用这些专家去进行组合,最终形成一个拟合得最好的。
2. Parametric Contrastive Learning
url:https://arxiv.org/abs/2107.12028
这篇Paper把supervised contrastive learning在long-tailed上做work了。我觉得work的主要原因是构造了propotypes,并且通过re-weight的方式,使得每一个instance都能让其他的每一类参与到优化。相较于原来的方法(Supervised Contrastive Learning),缓解了一些imbanlance的问题。由于存在科学的类别中心。所以需要更强的Aug和更久的训练时间。在Imgenet-LT上,训练400个epoch能达到57.0的点数。X101甚至能上60。

原文地址:https://www.cnblogs.com/JohnRan/p/15029520.html