京津冀数据处理day3

今天将行业以及关键字处理了一下,关键字处理的比较马虎,就是jieba分词,词频前三得

行业代码分类比较难

整了很久,现在成果类似如下

 还有待完善,这个处理的也比较马马虎虎。

 撑不住了。眼睛好干。。明早还有课,,

原文地址:https://www.cnblogs.com/msdog/p/12495481.html