Google PR 算法读后感

刚刚读完《谈 Page Rank – Google 的民主表决式网页排名技术》这篇文章,感觉如释重负,为什么呢?
因为我发现我终于弄懂了一个困惑我已久的问题:
研究SEO不久,还属于菜鸟阶段,之前在学习网页Page Rank排名的时候了解到:每个页面的PR值是来自于所有拥有指向自己的外部链接的页面,具体的页面PR值等于所在这些外部页面本身的PR值除以该页面所有链接数的平均数的总和(。。。这句话好长,不好表达)。
例如:我们求A页面的PR值,需要找到所有拥有指向A页面链接的页面B,C,D
如果,B的PR=9,全部链接数是3;C的PR=4,全部链接数是2;D的PR=10,全部链接数是5
那么他们指向A的链接分别值:B:9/3=3;C:4/2=2;D:10/5=2,那么他们给A的贡献是3+2+2=7
(当然实际的PR算法绝对不是这么简单)

看似很好懂,但是有个问题,每个页面的PR值来自于其他页面的PR值贡献,那么第一个网页的PR值从何而来?

看了上文,我似乎有所理解,文中大体介绍到,PR算法在解决一个页面初期PR赋值时经过以下几个步骤:

1. 假定所有网页初期拥有相同的PR默认值;
2. 经过N多次的迭代算法,直至收敛至自己的真实值(我不是学数学的,我不懂什么是迭代,什么是收敛,但是个人理解其大意为,虽然页面有一个初始值,但是经过N多次的迭代,随后都能无限接近其真实值,而且文中也强调初始值并不重要,迭代结果不受人为影响);
3. 由于运算工作量巨大,所以有采用了“稀疏算法”(我也不知道是啥玩意)减轻了工作量;缩短了迭代周期。我大胆猜测,这个所谓的迭代周期是否就是google的更新周期?
原文地址:https://www.cnblogs.com/vincedotnet/p/1580679.html