什么是脏数据(Dirty Data)?

脏数据(Dirty data 是一个术语,用于描述过时、不完整或不准确的任何类型的电子数据。此类数据可能是由于数据输入错误、未能定期更新数据或甚至多次输入同一数据而创建的。有时,不正确的数据只不过是电子文档文本中标点...
脏数据(Dirty data是一个术语,用于描述过时、不完整或不准确的任何类型的电子数据。此类数据可能是由于数据输入错误、未能定期更新数据或甚至多次输入同一数据而创建的。有时,不正确的数据只不过是电子文档文本中标点符号的错误。在其他情况下,脏数据可能是有意误导的信息,例如试图修改会计记录以向投资者和其他人呈现特定的图像。在数据库中发现的错误可能是由于输入数据时的人为错误造成的在大多数情况下,脏数据在任何类型的数据库中的积累都是无意的。在数据库中输入新信息的个人可能会拼错单词,遗漏对理解文本意图很重要的标点符号,或者无法遵循一种特定的格式策略。在这种情况下,更正错误信息是一个相对简单的过程,只需要修改不正确的文本并保存更改。企业有时通过在输入数据后校对数据并进行必要的更新来管理此过程企业有时通过在输入数据后校对数据并进行必要的更新来管理对不准确数据的更正由于在信息更改时未能更新现有记录,也可能会出现脏数据。例如,如果在给定客户发生人事变动时,销售人员未能更新客户文件,则这些文件将不再准确,并被视为脏文件。与更正拼写和标点错误一样,花时间删除过时的信息并用当前数据替换它有助于提高数据库的整体可用性。有些情况下,故意创建脏数据。公司可能会选择省略特定的从数据库中获取的信息,以便对财务状况产生特定的看法,例如突出显示某一特定时期的创收额,但选择不输入与同期已收收入额有关的数据。在这类脏数据中,所显示的信息是准确的是的,但被认为是不完整的。对于某些类型的脏数据,决策可能是不花时间和精力进行更正。当不正确的数据不会对业务正常运行的能力产生任何影响,或者不会造成任何重大困难时,这种情况很常见。这意味着,几乎任何维护某种类型数据库的实体都可能至少一些肮脏的数据和其他信息混杂在一起,这些信息是最新和准确的。
  • 发表于 2020-07-29 22:02
  • 阅读 ( 4578 )
  • 分类:电脑网络

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
admin
admin

0 篇文章

作家榜 »

  1. xiaonan123 189 文章
  2. 汤依妹儿 97 文章
  3. luogf229 46 文章
  4. jy02406749 45 文章
  5. 小凡 34 文章
  6. Daisy萌 32 文章
  7. 我的QQ3117863681 24 文章
  8. 华志健 23 文章

推荐文章

联系我们:uytrv@hotmail.com 问答工具