deepweb是互联网中不属于标准搜索方法的一部分。标准搜索引擎通过调出一个页面并点击所有链接来查找网页。这使得它们可以像巨大的蜘蛛网一样从单个页面扩展出去,通过链接找到一页又一页。这个过程只捕获互联网上存在...
deepweb是互联网中不属于标准搜索方法的一部分。标准搜索引擎通过调出一个页面并点击所有链接来查找网页。这使得它们可以像巨大的蜘蛛网一样从单个页面扩展出去,通过链接找到一页又一页。这个过程只捕获互联网上存在的网页的一小部分;由于许多原因,大量的数据是完全不保密的。这些网页永远不会出现在标准的搜索引擎中,因此对大多数网络用户来说是看不见的。deep web存在的原因主要是由于搜索引擎的限制,surface web是大多数用户都熟悉的Internet部分。此部分包含大多数用户都知道的标准网页和web服务。deep web由只有特定部分Internet用户知道或可以访问的信息组成。deep web与surface web相比是巨大的;在2000年,它是surface web的近50倍。deep web存在的原因主要是由于搜索引擎的局限性。当搜索引擎浏览链接时,它们无法访问某些类型的网页。这些网页从不进入系统,因此,永远不会索引。当用户搜索其中一个页面时,他或她将永远找不到它,因为搜索引擎不会记录它的存在或访问失败的情况。有许多不同的页面类型很难或不可能被搜索引擎索引。动态和基于数据库的网页实际上是不可能的,因为它们需要特定的输入才能存在。这些网页通常是通过用户输入的方式即时生成的。由于动态页面在需要时才存在,因此搜索引擎会跳过它们,因为它们不知道要问什么。私有或封闭的网页构成了deep web的另一大部分由于这些页面需要凭据或登录信息,而搜索引擎却没有,因此无法访问登录另一端的信息。即使存在此问题,一些基于登录的网站是surface web的一部分。该网站设置了允许引擎搜索其页面的特殊规定。这在具有开放注册并希望生成额外流量的页面中很常见。deep web的另一大部分是由未链接或受限制的网站组成的。这些页面不包含任何指向外部资源的链接或主动阻止现有链接。这可防止搜索引擎在页面上绊倒,因此不会将其添加到任何列表中。这以前在个人网页中很常见,但现代网络使用的变化已使大多数个人网页链接和索引
-
发表于 2020-08-06 14:43
- 阅读 ( 2116 )
- 分类:电脑网络