双聚类是一种数据挖掘技术,它通过同时分配矩阵的行和列将信息分类到矩阵中,其核心是效率,与单一聚类方法相比,允许计算机在较短的时间内筛选和排序大量数据。双聚类只是一类特定数据挖掘技术的总称;有许多不同的算法可以归...
双聚类是一种数据挖掘技术,它通过同时分配矩阵的行和列将信息分类到矩阵中,其核心是效率,与单一聚类方法相比,允许计算机在较短的时间内筛选和排序大量数据。双聚类只是一类特定数据挖掘技术的总称;有许多不同的算法可以归入这一类,包括块聚类、格子模型,耦合的双向聚类和相关的双向聚类。

数据挖掘需要大量的数据,例如从一家公司倾倒的信息;要理解双聚类的重要性,首先要了解数据挖掘的一般概念大量的数据——比如从公司的主数据库中转储的信息——并对其进行分类,以确定趋势和其他有用的模式。这种类型的分析可以用来确定那些不经意间研究就不明显的模式,例如消费者购买趋势和股票市场波动。数据挖掘可以由人类分析员手动进行,也可以使用某种数据挖掘算法以电子方式进行;这就是双聚类发挥作用的地方Biclustering是一种数据挖掘技术,它通过同时分配矩阵的行和列来将信息分类到矩阵中,进行分析的计算机将尝试将相关的信息片段相互分类。这个过程被称为"聚类"。聚类允许计算机通过识别两个或多个信息之间的关联来灵活运用其人工智能,把它们放在一个矩阵中。通常,矩阵的行或列都被填充,但一次只能有一个。双聚类通过使计算机同时填充行和列来消除这一限制。这提高了聚类过程的效率,但可能导致不同的排列矩阵取决于所使用的特定算法。例如,一台计算机在行中排列具有恒定匹配值的事物,而将具有恒定匹配值的事物排列在列中的计算机将使用完全相同的值生成不同外观的矩阵。没有一种"正确"的方法来聚类数据;这完全取决于进行数据挖掘的个人的特殊情况和偏好。