"数据扩散"是指政府和企业等实体存储的大量文件和数据量的总称,每天大量的数据流入意味着这些实体需要更多的空间和硬件,但截至2011年,数据激增的速度超过了计算机的发展速度。存储何种类型的信息并不重要,不管是结构化还...
"数据扩散"是指政府和企业等实体存储的大量文件和数据量的总称,每天大量的数据流入意味着这些实体需要更多的空间和硬件,但截至2011年,数据激增的速度超过了计算机的发展速度。存储何种类型的信息并不重要,不管是结构化还是非结构化的;重要的是计算机内存被占用。存储所有这些数据可能会很困难,导致额外的成本。数据激增的另一个问题是当一个大的实体需要更多的内存时,

,一般来说,它必须拥有更多的服务器。
数据激增的问题并不是消费者和普通计算机用户所关心的问题。虽然随着时间的推移,普通计算机用户需要更多的内存,但计算机能够以一定的速度发展,以满足这些需求然而,如果一个普通的计算机用户需要更多的计算机内存,他通常只会得到一个更大的硬盘。当一个大型实体需要更多的内存时,通常情况下,it部门必须获得更多的服务器。按照正常的速度,这不应该带来任何问题,但2011年许多大型实体的数据存储量正在以超过技术的速度增长,可能需要大量的服务器来存储实体需要存储的所有内容,这是因为计算机技术还不能使一个设备能够保存所有的信息,这意味着一个大型实体必须继续购买和使用越来越多的硬件
有些数据术语或问题只涉及一种类型的信息,但当涉及到数据的激增时,涉及到哪种类型的数据并不重要,只要计算机内存被快速占用,数据扩散就成了一个问题。
数据激增的许多问题之一就是成本。除了额外的存储硬件成本外,还有物理存储和人力资源成本。服务器必须放在某个地方,并且必须雇佣人员来运行服务器,这会导致理论上成本过高,使实体难以维持,并导致利润大幅下降。另一个问题是网络速度,因为数据堵塞可能导致程序运行速度慢得多,这意味着员工在一个工作日内可以做更少的工作。