数据清理,也称为数据清理,是确保一组数据正确和准确的过程。在此过程中,检查记录的准确性和一致性,并根据需要对其进行更正或删除。这可能发生在一组记录内,也可能发生在需要合并的多组数据之间或者可以一起工作。 一个程...
数据清理,也称为数据清理,是确保一组数据正确和准确的过程。在此过程中,检查记录的准确性和一致性,并根据需要对其进行更正或删除。这可能发生在一组记录内,也可能发生在需要合并的多组数据之间或者可以一起工作。

一个程序可以设置为删除所有在过去五年内未更新的记录。
简单过程
在最简单的形式上,数据清理是指一个人或多个人阅读一组记录并验证其准确性。更正打字错误和拼写错误,正确标记和归档错误标记的数据,这些操作通常会清除过期或不可恢复的记录,这样就不会占用空间并导致低效的操作。
复杂的过程
在更复杂的操作中,数据清理可以由计算机程序执行。这些程序可以根据用户决定的各种规则和程序检查数据。可以设置一个程序来删除过去五年内未更新的所有记录,更正任何拼写错误的单词并删除任何重复的副本。一个更复杂的程序可能能够根据正确的邮政编码填充缺失的城市,或者将数据库中所有项目的价格更改为另一种货币。
好处
数据清理对于任何依赖数据的业务的效率非常重要。如果数据库中的客户机没有准确的电话号码,例如,员工无法轻松与他们联系如果客户的电子邮件地址格式不正确,例如,自动电子邮件系统将无法发送最新的优惠券和特价商品。数据清理的工作是确保系统内的数据是正确的,以便系统能够使用这些数据。不准确或不完整的记录没有多大用处对于任何人。
每当两个数据系统需要协同工作时,数据清理就显得更为重要。如果一家公司有两个分支机构,它们与许多相同的客户一起工作,则不仅每个分支机构的数据必须完整准确,而且这两个分支机构还需要具有匹配的数据。当客户更新其手机时对于一个分支,另一个分支的数据需要用相同的信息进行更新,以确保最高的效率。数据清理不仅可以确保数据的准确性,还可以确保不同记录之间的一致性。
每当存储大量数据时,系统中都会出现错误数据清理的目标是尽量减少这些错误,并使数据尽可能有用和有意义。如果不定期执行此过程,错误和错误可能会累积起来,导致工作效率降低和复杂性增加。