简单了解搜索引擎是如何工作的

作者: fangjun 分类: seo工作笔记 发布时间: 2016-10-31 16:36
在看这篇文章之前,您可以先到搜索引擎搜索 这三个名词  万维网、搜索引擎、google 查看维基百科解释
搜索引擎在万维网络出现之前已经存在,那时在主机上的查询是 ArchieGopher等搜索工具,但是由于互联网的发展,传统的方式已经无法满足于用户搜索的需求,包括雅虎的分类目录网站都已无法实现用户对于数据获取的需求,智能化搜索引擎的发展是必然的趋势,它可以在极短时间内反馈给用户所需要的信息数据,既可以让优质的数据不被埋没,更能很大程度上节约用户的信息获取成本。
搜索引擎的基本原理就是 爬行-索引-建库的过程
第一步 爬行: 万维网给了搜索引擎一个很好的爬行基础,因为在万维网上的链接结构将所有公共网页联系在一起,而搜索引擎要做的就是通过爬虫机器从一组知名的众所周知的高质量的网站开始,然后访问每一个网页上的链接,顺着这些链接的爬行在发现其他的网页,就这样以一个树状的爬行路径不断的发现新的网页,因为每一秒钟都有庞大的数据产生,所以搜索引擎并不是每天试图爬行整个web网络。实际上,搜索引擎可以发现有些网页的重要性不足以出现在搜索引擎中,从而不对这些网页进行爬行。
第二步 索引: 搜索引擎的爬行器读取了一个网页后,下一步就是解析它们的代码,并将精选部分放到一个庞大的服务器体系中,以方便在查询时可以实时调用。搜索引擎将这些网页信息读取解析分类,建立关键词库。
第三部 检索排名:  检索和排名过程非常重要,搜索引擎根据用户搜索词的语义关系,返回与用户搜索需求最相关的结果,这一过程要遵循两项原则,第一、仅返回与搜索者查询相关的结果 第二、按照重要性,考虑网站的相关可信度和权威性来排序。这两项原则对于seo的影响非常大。
搜索引擎爬行器本身是一个非常庞大的软件,它们爬行数以万计的网页,分析所有页面的内容和这些网页相互之间的链接关系,然后,将这些数据组织为一系列的数据库,能够在零点几秒之内相应用户的搜索查询,向用户提交一组最合适的结果。

发表评论

电子邮件地址不会被公开。 必填项已用*标注