李彦宏超链分析专利,超链分析算法的作用
日期:2024-02-29 作者:攻硬营销
互联网上的信息非常的庞大,要想让用户搜索到精准信息是很难的。搜索引擎技术非常复杂。百度创始人李彦宏在创立百度之前就已经是国际上比较厉害的搜索引擎技术专家了。据说李彦宏在找风险投资时,投资人询问了三个搜索引擎界的技术牛人一个同样的问题:要了解搜索引擎技术应该找谁,其中两个人回答说找李彦宏,由此投资人就断定李彦宏是最了解搜索引擎的人之一。
这其实就是现实生活中链接关系的应用:要判断哪个人或网页最具权威性,不能光看这个人或网页,自己怎么说,还要看其他人对这个网页怎么评价。超链分析的基本原理是在某次搜索的所有结果中,被其他网页用超链指向得越多的网页,其价值就越高,就越应该在结果排序中排名越靠前。
超链分析是一种引用投票机制,对于静态网页或者网站主页,它具有一定的合量性,因为这样的网页容易根据其在互联网上受到的评价产生不同的超链指向量,超链分析的结果可以反映网页的重要程度,从而给用户提供出更重要、更有价值的搜索结果。
李彦宏1997年就提交了一份名为“超链文件检索系统和方法”的专利申请,这比Google创始人发明PR要早得多,不得不说这是非常具有前瞻性的研究工作。在这份专利中,李彦宏提出了与传统信息检索系统不同的基于链接的排名方法。
这个系统除了索引页面之外,还建立一个链接词库,记录链接锚文字的一些相关信息,如锚文字中包含哪些关键词,发出链接的页面索引,包含特定锚文字的链接总数,包含特定关键词的链接都指向哪些页面。词库不仅包含关键词原型,也包含同一个词千的其他衍生关键词。
根据这些链接数据,尤其是锚文字,计算出基于链接的文件相关性。在用户搜索时,将得到的基于链接的相关性与基于关键词匹配的传统相关性综合使用,得到更准确的排名。
超链分析就是通过分析链接网站的多少来评价被链接的网站质量,这保证了用户在百度搜索时,越受用户欢迎的内容排名越靠前。在今天看来这种基于链接的相关性计算是搜索引擎的常态,每个SEO人员都知道。但是在十七八年前,这无疑是非常创新的概念。百度CEO李彦宏就是超链分析专利的唯一持有人,目前该技术已为世界各大搜索引擎普遍采用。当然现在的搜索引擎算法对链接的考虑,已经不仅仅是锚文字,实际上要复杂得多。但是大量精准有效的外链是提高目标关键词排名的重要因素。在优化网站关键词排名的时候高权重的外部链接还是非常重要的。
上一篇:百度绿萝算法的意义和作用