Qrels supervision information以及document collection,如何划分为train、test,保证test中doc对于train来说是new document

简单的思想:转换为最小割问题

无向图的全局最小割算法:Stoer-Wagner算法

简介见:Wiki介绍得比较好并有源代码

最小割算法:http://blog.csdn.net/markpen/article/details/28614917

最小割集Stoer-Wagner算法:http://www.cnblogs.com/ylfdrib/archive/2010/08/17/1801784.html

原文地址:https://www.cnblogs.com/shuzirank/p/5660366.html