Data rengöring är processen för fastställande uppgifter och ta bort onödiga data i syfte att optimera dagliga Datawarehousing verksamheten . Datawarehousing är lagringen av data i ett centralt upplag så att vem som helst i en organisation kan komma åt den . För att Datawarehousing att bli framgångsrik , måste databasen informationen vara korrekt . Men med tanke på den stora mängd data som företagen arbetar med , kan dessa data inte alltid korrigeras manuellt . Därför är automatiserad rensning behövs . Tillgänglighet
Data rengöring måste göra de mest relevanta data snabbt tillgänglig för dem som söker det . Tid slösas bort söker igenom irrelevant information kan slösa tid för anställda och avfall företagets resurser . Information som är överflödig kan slösa utrymme företagets lagring .
Integrity
Data rensning får inte ta bort eller ändra data till där data blir felaktig. Felaktiga uppgifter kan leda till företagen att göra misstag som att skicka en räkning till fel adress , vilket kan ilska kunder och slösa pengar . Data måste också uppdateras hela databaserna . Om en kund uppdaterar en faktureringsadress , bör den här uppdateringen distribueras till databaser i alla relevanta avdelningar .
Organisera
Data rensning bör vidta relevanta data från olika källor och automatiskt flytta dessa data till lämpliga platser så att data kan lätt hittas när det behövs . Detta eliminerar behovet av att skapa nya data när data redan finns .
Felkorrigering
fel och inkonsekvenser , till exempel ett stavfel namn , bör lokaliseras och korrigeras av uppgifter reningsprocesser . Fel särskilt måste korrigeras i dator programmering , eftersom sådana fel kan orsaka datorsystem att inte fungera korrekt .
Automation
datarensning verktyg bör minimera mängden manuella indata som behövs . Med andra ord bör databasadministratörer inte ständigt starta processer själva men dessa processer bör ske automatiskt. Det bör också vara minimal programmering ansträngning behövs . Programmerare ska inte behöva koda när en rutinmässig åtgärd utförs .
Enkelhet
datarensning verktyg måste förenkla informationen när det är möjligt . Komplicerade uppgifter avfall företagets resurser och dessutom tvingar anställda att spendera mer tid på att leta efter viss information .
Analys
Post - processanalys är manuell undersökning av data efter att data har rengjorts . Oavsett hur effektiva datarensning processer är , kan oundvikliga misstag inträffa . Databasadministratörer måste fortfarande regelbundet kontrollera data manuellt för att säkerställa att uppgifterna är korrekta . Data Cleansing verktyg bör låta administratörer att visa data i ett lättförståeligt format så att korrigeringar kan göras snabbt .
Effektivitet
Data rensning kan vara tidskrävande och dyrt . Allt som kan skynda längs uppgifter reningsprocess eller minska kostnaderna förknippade med data rensningen är nödvändig för att maximera företagets lönsamhet .