数据集是从单一来源收集的相关数据的集合。该术语有多种用途,从调查结果汇编的信息到科学研究结果集。在计算机和互联网领域,数据集是一组数字或字节,通常显示在一个表中,其中的列将数据分类为子集。有几种数据集,包括顺序...
数据集是从单一来源收集的相关数据的集合。该术语有多种用途,从调查结果汇编的信息到科学研究结果集。在计算机和互联网领域,数据集是一组数字或字节,通常显示在一个表中,其中的列将数据分类为子集。有几种数据集,包括顺序、分区和虚拟存储访问方法(VSAM)。

包含数据的服务器机架。
数据集提供对特定主题或概念的洞察。它们存储应用程序或操作系统正常运行所需的信息。典型的系统包括宏库,源程序和系统参数或变量。这些集合可以被编目,这样就可以用一个容易理解的名称来引用它们,而不必参考特定的存储区域。
用于信息数据库(如保险或医疗记录)的程序也可以使用数据集在系统上运行的程序将信息存储在数据集中。其中一些数据集包含可生成报告的可读文本。这些类型的记录通常被称为单元,它们按单个标识符进行分类,例如客户或患者姓名。
数据集是根据其数量、访问频率和访问方法进行组织的。单个数据集的格式也取决于信息的预期用途。不同类型的数据集是不同的,但是它们之间有许多共同点。
连续变化的数据集以某种连续的顺序存储信息,这种方法最常用于按数字或字母顺序组织的信息为了从顺序数据集中访问一个项目,系统必须在任何已编程的组织系统中传递该项目之前的项目。
分区数据集允许更直接地访问项目。当有大量信息时,如大量数据库,可使用此方法地址或客户机信息。这些数据集也被称为库。信息的组织方式与顺序方法有点相似,尽管访问信息的方法不同。
虚拟存储访问方法(VSAM)是一种键顺序数据集(KSDS)。这些数据集都是存储的每个项目都附有特定的搜索信息,以便更快地访问每个项目。该系统最适合于使用方式不可预测和频率较高的数据集。