脏数据

从广义上看。脏数据是指没有进行过数据预处理而直接接收到的、处于原始状态的数据。
从狭义上看,是不符合研究要求,以及不可以对其直接进行对应的数据分析。
脏数据根据不同的分析目的有不同的定义。如在常见的数据挖掘工作中。脏数据是指不完整、含噪声、不一致的数据;而在问卷分析中,脏数据则是指不符合问卷要求的数据。

开发中:
脏数据是指源系统中的数据不在给定的范围内或对于实际业务毫无意义,或是数据格式非法,以及在源系统中存在不规范的编码和含糊的业务逻辑。

在数据库技术中,脏数据在暂时更新(脏读)中产生。

事务A更新了某个数据项X,可是因为某种原因。事务A出现了问题。于是要把A回滚。

可是在回滚之前。还有一个事务B读取了数据项X的值(A更新后),A回滚了事务,数据项恢复了原值。事务B读取的就是数据项X的就是一个“暂时”的值,就是脏数据。

通俗的讲,当一个事务正在訪问数据,而且对数据进行了改动。而这样的改动还没有提交到数据库中,这时。另外一个事务也訪问这个数据。然后使用了这个数据。由于这个数据是还没有提交的数据,那么另外一个事务读到的这个数据是脏数据,根据脏数据所做的操作可能是不对的。

此文加深理解,仅为记录所用。

參考:

版权声明:本文博主原创文章,博客,未经同意不得转载。

原文地址:https://www.cnblogs.com/blfshiye/p/4795779.html