4-5学习笔记

1.xlnet原理学习 

 https://zhuanlan.zhihu.com/p/70257427 学习一下这个,但是好多理论,看不下去。

2.chrome下载文件时出现了,网络失败,已被禁用

https://www.cnblogs.com/SHGF/p/6558227.html 然后根据这个设置了一下,居然神奇地ok了,也是牛。。。

3.数据不平衡

https://blog.csdn.net/songhk0209/article/details/71484469 讲了数据不平衡所会产生的问题,就会导致模型的recall或者precision下降。

其中有一个办法,层级化集成,我倒觉得这个可以试试。

那就把五折中dev都预测错的放在一起,然后去训练2号模型,但是后来用分类不一致的数据训练L3,但是L1和L2中分类一致不就是这两个模型都分错了吗?为什么不用这个分类一致的去训练L3呢??

https://zhuanlan.zhihu.com/p/32940093 微调的文章,待看,关于数据不平衡的

4.什么比例的数据会被认为是不平衡的呢?

https://sunjunee.github.io/2018/02/01/biased-data-processing/ 这里面说是在10:1,100:1,1000:1的时候才考虑不平衡,那我这3:1还要考虑数据不平衡吗?

https://www.jiqizhixin.com/articles/2016-08-30 这里面说:是10-20%的,那我这16%的其实也算是不平衡了。

可以处理一下,有思路了。

5.kaggle模型集成教程

https://mlwave.com/kaggle-ensembling-guide/ 继续学习一下这个模型集成。 

2020-4-6周一

1.这两个roberta有什么区别?

感觉好像都是一样的模型啊,模型大小也差不多。。。。也都是roberta啊。

原文地址:https://www.cnblogs.com/BlueBlueSea/p/12640908.html