唐诗三百首分词词频分析

发现本博客的文章也有随意转载了,而且排名还比原文高。所以加上申明,本文不得转载。

http://www.cnblogs.com/cartler

 

下面是正文,看到微博上词频分析很火,自己也试了下。

过程很简单,但结果很有趣,所以先上结果。

成果基本可以由下面这首"唐诗"概括,o(≧v≦)o~~好棒~

 

不见万里在何处

琵琶明月尤不知

不得春风思故人

长安将军今无人

 

出现频率最高的如下:

 

从结果还可以分析出一些东西:

比如:蜀道之难难于上青天,仅仅这一句就出现过三次,[出典] 李白 《蜀道难》。

还可以从词频中分析出,诗人们大多生活在长安生活,因为仅仅长安这个首都就出现过12次之多。

还可以看出大部分唐诗主要是表达思念的,而思念的对象排名第一的居然是将军、第二的是故人、第三才是美人。。。╭( ̄m ̄*)╮╭( ̄m ̄*)╮╭( ̄m ̄*)╮

总的来看,唐诗的内容还是负能量远大于正能量,哈哈。

 

以下是前50的词频:

 

http://www.cnblogs.com/cartler

不得转载

原文地址:https://www.cnblogs.com/cartler/p/4562327.html