大数据是对数据的度量,这些数据已经增长到普通数据库无法容纳和处理大量的信息。数据有三种大小:小、中、大;这些度量都不是严格的;相反,每种类型的数据更多地取决于易用性和哪种机器可以处理信息。大数据需要特殊机器,比普...
大数据是对数据的度量,这些数据已经增长到普通数据库无法容纳和处理大量的信息。数据有三种大小:小、中、大;这些度量都不是严格的;相反,每种类型的数据更多地取决于易用性和哪种机器可以处理信息。大数据需要特殊机器,比普通数据库的机器大得多,复杂得多。这些类型的数据通常在政府和科学机构中找到,但是一些非常大的网站也包含了大量的信息。大数据是一个经常与云计算联系在一起的热门词汇。数据有三种标准尺寸,但并不严格。小数据可以放在一台计算机或机器上,例如笔记本电脑。中型数据可以放在磁盘阵列上,最好由数据库管理。数据库,无论多大,都不能处理大数据,而必须使用特殊的系统。虽然对什么是大数据没有严格的指导方针,它通常从TB级开始,一直到PB级。试图在一个不专门处理这些数据量的数据库上处理大数据会导致几个实质性的问题。数据库无法处理大量的信息,所以有些数据必须被删除。这就像试图在一台只有50GB硬盘空间的计算机上安装100GB的内存;这是不可能的。剩下的数据将难以控制和管理,因为任何功能都需要很长时间才能完成,而且数据库必须关闭,不允许新的提交。虽然可以继续购买机器并向数据库中添加新数据,但这造成了难以处理的问题。这是因为数据库软件只用于处理中量数据较大的数据集会导致错误和管理问题,因为软件根本无法移动或处理大数据而不会遇到问题。大多数组织或网站都不会遇到大数据。国防和军事机构使用这些信息来创建模型和存储测试结果,许多大型科学机构也出于类似的原因需要这些专门的机器。一些非常大的网站需要大型的数据机器,但在这个市场上,网站并不像机构那么普遍。这些机构需要保留所有的数据,因为这有助于更好地分析未来的数据并作出预测
-
发表于 2020-08-07 07:25
- 阅读 ( 755 )
- 分类:电脑网络