搜索引擎基本上是一种计算机算法,可以帮助用户找到他们要找的特定信息。不同的搜索引擎以不同的方式工作,但它们都使用相同的基本原理。 互联网搜索引擎旨在帮助用户找到他们在网上寻找的东西搜索引擎要想发挥作用,首先...
搜索引擎基本上是一种计算机算法,可以帮助用户找到他们要找的特定信息。不同的搜索引擎以不同的方式工作,但它们都使用相同的基本原理。

互联网搜索引擎旨在帮助用户找到他们在网上寻找的东西搜索引擎要想发挥作用,首先要做的就是建立一个本地数据库,基本上,互联网。早期版本只是索引了网页的关键词和标题,而现代版本则索引了每一页上的所有文本,以及关于该网页与其他网页的关系的大量其他数据,以及在某些情况下,页面上的所有或部分媒体也是如此。搜索引擎需要索引所有这些信息,以便能够有效地在上面运行搜索,而不是每次发送搜索查询时都必须在Internet上运行

搜索引擎的最新趋势是摆脱基于关键字的搜索,而采用基于概念的搜索早期的版本通常需要将页面提交给它们,以便对它们进行爬网,但现在大多数页面都是通过跟踪其他页面的链接来找到的所谓的"机器人"或"蜘蛛",是为索引页面而构建的计算机程序,从一页到另一页,记录页面上的所有数据,并跟踪每个链接到新页面。不同的搜索引擎以不同的时间间隔刷新索引,这取决于它们不断爬行的蜘蛛数量和蜘蛛爬行的速度一些人每天或两天上网,另一些人则每周或每月定期刷新。当蜘蛛浏览这些网页时,它记录在页面上找到的单词,记录每个单词出现的次数,单词是否以某种方式加权,可能是基于大小、位置或HTML标记,并根据进入页面的链接和页面的一般上下文来决定单词的相关性然后,搜索引擎必须衡量每一页的价值,以及每一页上出现的单词的价值。这是最棘手的部分,也是最重要的。在最简单的层面上,它可以简单地跟踪页面上的每个单词,并将该页面记录为与该关键字搜索相关的页面。然而,这对大多数用户没有多大好处,因为所需要的是与搜索查询最相关的页面。因此,不同的引擎会采用不同的方法来加权重要性各种搜索引擎使用的算法都得到了很好的保护,以防止人们为了获得更好的排名而专门创建页面,或者至少限制他们可以这样做的程度。这就是为什么不同的搜索引擎对相同的词产生不同的结果Google可能会认为一个页面是搜索词的最佳结果,Ask可能会确定同一个页面甚至不在前50名中。这完全是基于他们如何评价入站和出站链接、他们认为重要的关键字的密度、他们如何评价词的不同位置以及任何数量的较小因素搜索引擎的最新趋势,也可能是整个搜索的未来,是从基于关键字的搜索转移到基于概念的搜索。在这种新的搜索形式中,不再局限于搜索者输入的关键字,该程序试图找出这些关键字的含义,这样它就可以建议那些可能不包括确切的单词,但仍然是搜索主题的页面。这仍然是一个发展中的领域,但到目前为止,似乎有很大的潜力使搜索更具相关性,使网络成为一个更容易找到你想要的东西的地方。