项目改进

样本和数据应该分开;

策略:

1.首先选择样本,并在数组中记录ID

2.保存数据特征时进行重复性判断保存即可。

伪代码:

choose sample

 vector vt<- sample_region_ID && File sample_file <- sample_feature

save features

  search in vt

     if not in vt

         then save features

原文地址:https://www.cnblogs.com/xiangshancuizhu/p/2149920.html