读书笔记(5)

今天要讲的是数学之美的第十四章,关于余弦定理和新闻的分类,这是一个特别有意思的东西。

可能看起来,这两个完全没有关系,一个是数学上的一个定理,一个是分类的方式,有什么关联吗?

确实是有的。

先从新闻的分类来讲。既然要对新闻进行分类,那么就需要一些新闻的特征,比如新闻的主题是关于什么方面的,战争的,经济的,文化的;再比如新闻的出版社是什么,人民出版社,邮电出版社等。可以将其设定为x1,x2,x3...

这些不变量就会组成一个向量(x1,x2,x3,...),之后可以将另一个新闻设置成另外一个向量(y1,y2,y3,...)。xn,yn都是同一个维度的变量,如果是主题,那么就都是主题。

这样,就可以通过将这两个向量做内积,从而形成一个关于夹角的函数,夹角就会越小,其余弦越接近1,两个新闻就越相似。

如果需要的分类比较多,那么就可以采取迭代的方式。先将多个分类合成一个小类,之后依次向上聚合,最后变成几个大类。

数学之美这本书真是越读越感觉有意思了。

原文地址:https://www.cnblogs.com/tianxiayoujiu/p/9248969.html