数据挖掘十大经典算法之——PageRank 算法

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sunyaowu315/article/details/88844297

数据挖掘十大经典算法系列,点击链接直接跳转

简介

PageRank是google 的页面排序算法,是基于从许多优质的网页链接过来的网页,必定还是优质网页的回归关系,来判定所有网页的重要性。(也就是说,一个人有着越多牛X 朋友的人,他是牛X 的概率就越大。)

优点:

完全独立于查询,只依赖于网页链接结构,可以离线计算。

缺点:

1)PageRank 算法忽略了网页搜索的时效性。

2)旧网页排序很高,存在时间长,积累了大量的in-links,拥有最新资讯的新网页排名却很低,因为它们几乎没有in-links。

猜你喜欢

转载自blog.csdn.net/sunyaowu315/article/details/88844297