数据挖掘牛人的微博圈子

     最近一直在玩微博,并在上面认识了好多大牛。每当大牛发表关于技术的状态,我这种菜鸟都能从中学到很多的东西。然后自己就突发奇想,如果能够从所有的微博用户中,找出来这些大牛,这样信息的来源不就可以大大的扩展了嘛。

    于是,就试着用新浪微博的API写了一个小程序,根据一些我所知道的关于数据挖掘领域中并且在微博中很活跃的两三个人入手,从他们的关注与粉丝圈子中慢慢的扩展,最终可以找到挺多的相同领域的人。

     比如:我试着输入三个在微博中比较活跃的数据挖掘的强人:百度_**,还是**,**_机器学习。通过他们之间的关系的判断,他们的粉丝之间的关系的判断,他们好友的关系的判断,他们好友与粉丝之间关系的判断,最终得到了一个活跃微博上的在数据挖掘强人小圈子。在没有迭代的情况下,第一次挖出来了大概一共18个人,经过调查,这18哥人中,有17个人与数据挖掘领域相关,并由15个人经常发布数据挖掘的技术信息。

     其实,不但是数据挖掘的圈子,很多圈子都可以通过相同的方式进行挖掘。

     由于保护隐私的需要,我隐去了这个圈子所有人的名字,如果有人需要得到这方便的信息,留下邮箱,我私下回复你们。

     

berkeleysong
原文地址:https://www.cnblogs.com/berkeleysong/p/3252663.html