我终于有点空余的时间可以用来写出这篇长篇文章了,为了让站长和部落客们对 Pagerank 有更深的认识,我打算从头到尾向大家介绍 Google 的镇山之宝 PageRank 。我打算把它分成几段来写,今天就先来谈谈 Google Pagerank 的由来,看看 Pagerank 的诞生史。
Google PageRank 第一章 Pagerank 的历史现在开始。
为了避免你们可能看得一头雾水,我先在这里提一下, Google 的两位创办人是 Larry Page 和 Sergey Brin 。
研究院的 Larry Page
1995 年在美国的夏天, Larry Page 从密歇根大学( University of Michigan )毕业了,他从事学术研究的父亲 Carl Page 希望他可以继续深造完成博士学位。为了决定深造的大学研究院, Larry Page 来到了斯丹福大学( Stanford University )参观,当时他遇到的向导就是 Sergey Brin 。
选互联网为博士课题
很快地 Larry Page 决定了进入斯丹福大学,入学后他第一件考虑的事情就是决定博士课题。经过一番深思熟虑,他决定了当时正在迅速萌芽的互联网。
Larry Page 对互联网最有兴趣的地方是它复杂的数学结构,他认为互联网是人类有史以来创高过最大的网络,互联网里隐藏着许多有用的信息,可是互联网最大的缺点就是太大了,想要获得这些有用的信息是件很困难的事,从此他致力于这方面的研究。
网页评级的概念
Larry Page 发现,在一个网页上链接到其他的网页非常简单,可是从别的网页链接到同一个网页却很困难,如果想知道某个网页被多少网页链接了更是难上加难,他觉得解决这些难题可能有很大的用处。
在研究评级网页的时候, Larry Page 联想到了评价学术论文,他发现评级一个网页和评价一篇学术论西相似,除了文章的内容,它所引用和被引用的文章也很重要,而对于网页来说,它引用的就是网页的链接,它被引用就是其他网站对它的链接。
搜索引擎 BackRub
有了这样初步构想后, Larry Page 设计了一个实验性质的搜索引擎 BackRub , BackRub 对 1000 万个网页进行了分析。1996 年 3 月, Larry Page 将 BackRub 放上了自己的个人网页,当时的他并不知道他已经建立了世界上第一个网页爬行机器人。
Sergey Brin 的加入
由于这个课题的复杂性超越了一般博士生的能力范围, Larry Page 没办法自己一个人进行实验,需要帮助的他邀请了 Sergey Brin 加入。
Sergey Brin 在 6 岁时全家从俄罗斯移民来美国,他的父亲是美国国家航空和航天局的科学家和马里兰大学的教授。他自己则在数学方面拥天才般的天赋, Larry Page 需要的算法研究正是他的强项。
PageRank 的诞生
Larry Page 和 Sergey Brin 一同开发了最原始的 PageRank 网页评级系统,系统的原理是,当网页 A 链接到网页 B ,网页 A 就等像投了票给网页 B ,要是网页 A 的重要性比较高,它投给网页 B 的票数就越多,通过统计这些票数, PageRank 得以判断网页的重要性。
PageRank 的潜能
Larry Page 和 Sergey Brin 对 PageRank 系统的改进没有停下来,过后他们把网评评级系统和文本匹配技术结合了在一起,让这时候的 BackRub 已经成为了非常强大的搜索系统,远胜于当时那些只用了文本匹配技术的搜索引擎。
由于 PageRank 是依靠网页链接来作为数据进行统计,所以网页的数量越多就会有越准确的搜索,对 BackRub 就越好,这点与其他的搜索引擎完全相反。
当年的 Larry Page 只是一心想完成自己的博士学位,根本没想过创办公司, BackRub 搜索引擎慢慢有名了起来后, Larry Page 和 Sergey Brin 发现了它的价值,所以兴奋地想将 BackRub 卖出去。可是当时的互联网巨头如 Yahoo 、 Infoseek 、 Excite 等都对这两位大学生的技术没有兴趣。
Google 的创始
Larry Page 走进了斯坦福大学技术授权办公室,要求对 PageRank 进行许可,好让他可以得到版税以支持他日后的学术研究。可惜专利只能够许可给公司,而 Larry Page 只是个人,不能被许可。感到无比失望的 Larry Page 和 Sergey Brin 两人最后决定自己创办公司。
1998 年 9 月, Google 公司在车库中诞生了,凭着 PageRank 技术, Larry Page 和 Sergey Brin 开始了他们艰辛的创业历程,而今天我们所看到的 Google 就是他们两个人过后的成果。
第二章 Pagerank 算法和 Google 搜索
看了第一章《 Pagerank 的历史》,大家应该知道了 PageRank 的由来,听过了 PageRank 是怎么在 Larry Page 和 Sergey Brin 的努力下诞生的。
今天 Google PageRank 是什么第二章,我会开始带着大家一起初步认识 PageRank 和 Google 搜索结果,看看 Pagerank 的原理。
PageRank 的重要性
PageRank 之所以那么重要对不同的人而言有不同的原因,我可以想到的和 PageRank 有关系的人有 Google 本身、 Google 的用户和网站站长(包括部落客)。
对于 Google 本身来说, PageRank 成就了自己, Google 今天可以坐上网络第一把交椅,成为网络第一大巨头,很大的原因来自 PageRank 技术,因为 PageRank 技术让 Google 的搜索结果比其他的搜索引擎优秀许多。
对于 Google 用户来说,他们搜索得到的 Google 搜索结果就是被 PageRank 所影响的,这些搜索结果让 Google 用户可以从浩瀚互联网中快速找到准确的资料,是网民们重要的工具,让网民的许多工作都事半功倍。
最后是互联网上许许多多网站的站长,这里的站长也包括了我们这些部落客,网站在搜索结果中的排名对许多网站来说是生存的关键,也关系着商业网站公司的盈利,对于很多网站来说,在搜索结果内的低排名等于倒闭。
在这篇文章中,我只会注重在 PageRank 和站长这方面。
PageRank 的基本原理/算法
PageRank 的基本原理是,当网页 A 链接到网页 B ,网页 A 就等像投了票给网页 B ,要是网页 A 的重要性比较高,它投给网页 B 的票数就越多,通过统计这些票数来判断网页的重要性。
我们直接来看看 PageRank 是如何决定的,请看图。
图中的长方形是网页,左上角的网页因为得到其他网页的投票,它拥有了 100 个票数,它把得到的票数平分了给它链接的网站,在图中是两个网站,这两个网站分别得到 50 个票数。
右上角的网站得到了 50 个票数,又从另一个网站得到 3 个票数,结果它拥有总数为 53 的票数。
简单来说,一个网页拥有的票数是所有反向链接的票数总和,而一个网页可以投的票数决定于它拥有的票数。当这个网页链接到其他网页,它拥有的票数会平分给它链接的网页。
澄清一点,这里所解释的只是 PageRank 的基本原理,不是完全的 PageRank 计算方式,因为没有人真正知道。
PageRank 与网页内容无关
还有很重要的一点,很多人以为网页的内容对 PageRank 值存在影响力,其实完全没有, PageRank 的数值完全决定于上面所解释的链接投票。
PageRank 和 Google 搜索结果
我们知道,站长们会重视着 PageRank 是因为 PageRank 影响着他们网站在 Google 搜索结果上的排名,那么 Google 的搜索结果是怎么决定的呢?
老实说吧,除了 Google 内部的某些中坚员工,世界人没有任何人真正知道 Google 的搜索结果和 PageRank 是如何决定的。
虽然不能真正知道全部,我们还是知道某些重要的因素,从第一章《 Pagerank 的历史》我们看到, Google 的搜索结果主要由 PageRank 和文本匹配技术决定,再加上其他超过 200 个元素。
所以,网页在搜索结果的排名是由许许多多的因素计算出来的,网页的 PageRank 只是其中一个因素。
我的废话
今天的第二章就到这里为止,请继续关注 KennyP.cn 的 Google PageRank ,下次的第三章我们会更加深入地探讨 PageRank 。
在《 Google PageRank 是什么》第一章我向大家讲述了 Google PageRank 的历史由来,第二章则告诉了大家 PageRank 的算法和 PageRank 与 Google 搜索之间的关系。
今天第三章我相信是网站站长和部落客( blogger )们最感兴趣的题目,就是《如何提高/提升网站或部落格 PageRank ?》。
我会尽量将自己所知道的和从其他网站参考到的全部告诉大家,希望有助于提升你们的网站或部落格的 PageRank 。
反向链接、内部连接和外部链接
在开始这一章之前,我要先确定大家明白以下几个名词。
- 反向链接( backlinks ):我们都知道什么是链接,反向链接顾名思义就是反过来的链接,也就是别人对你的链接,假设你的网站链接来 KennyP.cn ,你网站的这个链接就是 KennyP.cn 的反向链接。
- 内部连接和外部链接( internal links & external links ):同样都是链接,我们还分为内部和外部,内部链接就是自己网页链接到自己网页,我在 KennyP.cn 的任何网页上链接到 KennyP.cn 任何其他的网页就是内部连接;外部链接就刚好相反,如果一个链接不是链接到自己域名( domains )下的网页,它就称为外部链接,假设我在 KennyP.cn 链接到你的网站,这个链接对 KennyP.cn 来说就是外部链接。
如何提高 PageRank ?
在第二章 PageRank 的算法,我告诉了大家 PageRank 的基本原理:
当网页 A 链接到网页 B ,网页 A 就等于投了票给网页 B ,要是网页 A 的重要性比较高,它投给网页 B 的票数就越多,通过统计这些票数来判断网页的重要性。
PageRank 表示的就是一个网页的重要性,从上面 PageRank 的原理我们已经可以看到提高 PageRank 的方法了。重点有两个,第 1 就是越多的“票数”,你的 PageRank 就越高;第 2 就是越重要的网站投票给你,你得到的“票数”就越多, PageRank 就越高。
所以提高 PageRank 的方法就是让很多重要的网页投你一票,简单来说就是要让很多高 PageRank 的网页链接到你的网站,增加高质量的反向链接,这就是第 3 章的重点,也是提高 PageRank 最基本的方法。
如何增加高质量反向链接?
现在真正的问题来了,你已经知道了你需要高 PageRank 的网页链接到你网站或部落格,可是要怎么得到这些高质量的反向链接呢?
1. 提供有用的内容:最长远而有效的方法就是提供对用户有用的内容,你要明白网民们想看的是什么内容,然后提供他们想得到的信息,最后自然就会有网站链接到这些内容。
2. 交换链接:我这里所说的交换链接不是叫你随便找一些网站互相链接,而是要找一些内容和你网站或部落格相关而且 PageRank 最好比你高的网站来交换链接,你应该锁定的交换对象是内容相关和高 PageRank。
3. 购买链接:交换链接是比较不容易的办法,因为别人的 PageRank 比你高,你们互相连接只会对你一方有好处,所以你往往需要低声下气“求”链接。可是购买链接的话就不同了,大家各取所需,他得到你的钱,你得到他的链接。你可以到像 Text Link Ads 这样的广告网络找到许多售卖付费链接( sponsored links )的网站。
4. 提供免费资源:还有一个很有效的方法就是提供对大家有用而且免费的资源,比如说提供可爱有趣的 MSN 图片。在免费资源的驱使下,大量的网站或部落格就会争相链接到你的网站。
5. 参与社交网络:社交网络如 Digg 是 Web 2.0 兴起的新类型网站,这类网站的主要内容是由用户生成的,而用户一般会拥有一个显示个人的页面。如果你在一些著名的社交网络很活跃,你的个人页面可能会拥有很高的 PageRank ,你就可以在这个高 PageRank 的页面上链接到你的网站。
6. 管理链接:最后就是管理网站的链接,这对 PageRank 的内部分发有重要的影响,详情请往下看。
管理链接
不要忘了,你自己也有投票的权利,你也可以自己投票给自己,在 PageRank 比较高的网页链接到 PageRank 比较低的网页就提高自己网页的 PageRank 。
在第二章 PageRank 的算法,我向你们解释过 PageRank 的投票过程,我在这里再用例子大概解释一次。假设 KennyP.cn 的首页有 100 分,如果我在首页放了 5 个链接,首页的 100 分就会平分给每个链接,分别得到 20 分。如果这 5 个链接里有 4 个是外部链接,只有 1 个是内部链接,那么就有 80 分投了给别人的网页,只有 20 分是你自己的网页得到。
了解了我上面所说的东西你就要想办法好好分配和管理你网页上的链接了,我在这里给大家一条思路。假设你的网站有两个网页,这里称为 A 网页和 B 网页, A 网页拥有高 PageRank 而 B 网页拥有低 PageRank ,当你链接到别人的网站时你应该把链接放在 B 网页, A 网页上的链接就尽量放自己的网站,这样你整体的 PageRank 就不会流失出去而是流回给自己。
我的废话
提高 PageRank 的详细方法要视每个网站不同的状况和结构而定,基本的概念和原理我在上面提过了,各位站长和部落客们就要自己变通随机应变,自己选择和想出最适合自己网站的方法。
posted on 2008-02-02 11:25
无所谓啊 阅读(47)
评论(2) 编辑 收藏 所属分类:
网站策划编辑与优化
网摘收藏