Google PR算法

比如两个由4个页面共同组成的圈子:A,B, C 和 D。假如大部份页面都链向A,所以A的PR(PageRank)值将是B,C 及 D的和。

PR(A) = PR(B) + PR(C) + PR(D)

竭尽全力假定B也有镜像到C,因此D也有镜像到主要包括A的3个页面。两个页面无法投票表决2次。因此B给每一页面免票。以反之亦然的方法论,D击出的票多于一半抹掉了A的 PageRank 上。

魅力依扬真的,依照链处数目均分两个页面的PR值。

最终,大部份这些被换算成为两个比率再乘上两个常数q。虽然上面的演算法,没页面的PageRank会是0。因此,Google透过微积分控制系统给了每一页面两个最大值1 − q。

因此两个页面的 PageRank 是由其它页面的PageRank排序获得。Google 急速的多次重复排序每一页面的 PageRank。假如您给每一页面两个乱数 PageRank 值(非0),所以历经急速的多次重复排序,这些页面的 PR 参数值趋向恒定和平衡。这是浏览器采用它的其原因。

二、完备的演算法:

那个方程组导入了乱数下载的基本概念,即没人玩游戏无趣乱数关上许多页面,点许多镜像。两个页面的PageRank值也负面影响了它被乱数下载的机率。为的是易于认知,这儿假定访问者急速点页面上的镜像,最终到了两个没任何人链出页面的页面,这时访问者会乱数到除此之外的页面已经开始下载。

为的是对这些有链出的页面公正,q = 0.15(q的象征意义见Courtomer)的演算法被加进了大部份页面上, 估计页面可能将被访问者放进记事本的机率。

因此,那个式子如下表所示:

p1,p2,…,pN是被研究的页面,M(pi)是链入pi页面的数量,L(pj)是pj链出页面的数量,而N是大部份页面的数量

PageRank值是两个特殊矩阵中的特征向量。那个特征向量为

R是式子的答案

假如pj不链向pi, 而且对每一j都成立时,等于 0

这项技术主要的弊端是,旧的页面等级会比新页面高,因为新页面,即使是非常好的页面,也不会有很多镜像,除非他是两个站点的子站点。

这是 PageRank 需要多项演算法结合的其原因。之前石头也说了wikipedia.com在google的许多关键词内表现很好整体的访问量超过许多门户网站,另一方面也是数万网民的共同努力。

Google对维基百科情有独钟之一,魅力依扬想应该是:PageRank 似乎倾向于维基百科页面,在条目名称的搜索结果中总在大多数或者其它大部份页面之前。其原因主要是维基百科内相互的镜像很多,因此有很多站点链入。

Google 经常处罚恶意提高 PageRank 的行为。Google 究竟怎样区分恒定的镜像交换和不恒定的镜像堆积仍然是商业机密。

相信看完以上内容后对PageRank了解更深入。

我们可以知道浏览器用来评估页面质量的一种方法,是PageRank,它经常被用来当作对Google浏览器页面要素评分之一。

你可以找到任何人页面的PageRank分数,透过采用你的下载器去下载页面,并下载GOOGLE工具栏。将你的鼠标放在绿色的PageRank栏上,马上就会显示出两个从0到10之间的数字,这是PageRank值,是google对该页面的重要性的分配。工具栏按照PageRank比例范围显示出页面的PageRank,但是在现在的PageRank演算法中是不单单是0到10的数据了,在google的服务器中,PageRank的分配数有可能将是0精确到100,甚至是到1000的数值。

PageRank是平均每三个月更新一次的,它不是按照一般的线性刻度排序,而是按照一种指数刻度。这是一种非常繁杂的微积分术语(之前文章也有提到),意思是PageRank4不是比PageRank3好一级—而是会好6到7倍。因此两个PageRank5的页面和PageRank8的页面之间的差距会比你可能将认为的要大很多。

PageRank值在这几天要更新了,我们谈谈现在PR的演算法吧!当两个页面镜像到你的页面时,浏览器是怎样转移那个页面的权威性到你的网站的(也是PageRank的转移)。因此你希望从有最高PageRank得分的页面上获得镜像,去急速的寻找高PR的站点,是不是呢?

这种方式在以前还管用,但是现在实际情况比这复杂了很多,两个权威性的转移与页面上存在的镜像数量有关—镜像越少,每一镜像所转移的权威性就越高,因些,通常PageRank5页面上唯一的镜像要比PageRank7上一百个镜像中的两个要有价值。当然这也是有前提的,是站于站之间的镜像内容相似度要高许多。如:A(SEO资料站)站同时链向B(SEO服务网站)、C(企业服装网站)所以A站的PageRank转移到B、C那个站所得的分高呢,在众多的实验证明B站获得A站的PR转移得分比C站高,其原因很简单:A、B二站的相似度很高,所得的得分也自然高。

之前所讲的大家都知道PR值的重要性,但是真的一提的是,不要落入PageRank的诱惑陷阱中。对于你的页面来说,最重要的是被镜像到这些能为你的站点带来流量的站点,而不是见到PageRank就链。要将PageRank作为工具来验证你自己对两个潜在镜像来源质量判断,而不要在做你的镜像来源列表时盲目跟从PageRank。

防走丢!请关注公众号:万项汇

版权声明:
作者:wxfb
链接:https://www.28php.com/6448.html
文章版权归作者所有,未经允许请勿转载。
THE END
分享
二维码
< <上一篇
下一篇>>