Extract, Transform och Load ( ETL ) verktyg hämta data från en extern källa , förändra den eller ändra den och sedan läsa in den i en destination databas eller . ETL-verktyg fråga databaser för information som skall extraheras , transformeras och presenteras eller laddas in destinationen databasen . ETL query tekniker kan baseras på metadata , data- parametrar och frågor från användare . ETL frågor körs på begäran eller på en regelbunden basis . Multi - level frågor i ETL-verktyg kan köras med analytisk bearbetning online ( OLAP ) motorer . Metadata
Metadata informationen beskriver informationen i en cell eller bifogad fil som lagras i databasen . Användarfrågor kan baseras på specifika sökord eller filnamn . ETL-verktyg kan hämta information söker användartillhandahållen termer inom metadata . Söka en databas för ett visst ritningsnummer eller kreatörer dokument är en metadata fråga . ETL-verktyg användas för data kartläggning söka efter värden i celler med ett specifikt namn eller en referens och kopiera dem till målceller med den mappade namn eller referens .
Ad Hoc
Ad hoc metoder specialiserad eller unik .
ad hoc-rapporter är anpassade och skräddarsydda efter den enskilde användaren . Ad hoc-rapporter kan vara smala delmängder av befintliga rapporter eller baserade på befintliga rapporter med ytterligare parametrar . Ad hoc-rapporter kan också skapas från grunden . Användarna kör ad hoc-rapporter när det behövs .
Regelbundna uppdateringar
Hämta data från en databas och konvertera det till det format för användning i en annan databas resulterar i ETL verktyg användning i regelbundna uppdateringar av data mellan system . Regelbundna uppdateringar sker vid vissa intervall , t.ex. nattliga eller veckovis . Help desk-personal kan ha möjlighet att manuellt utlösa en periodisk uppdatering efter en kommunikation eller datorsystem strömavbrott . Range partitionering delar data baserat på datum . Range partitionering används för att dra poster för en given tidsperiod. Data utanför intervallet partitionerna inte efterfrågas . Regelbundna uppdateringar är baserade på olika partitionering med dagen för den senaste uppdateringen ställa in partitionen gränsen .
Kvalitetsmått
åtgärder
Kvalitet för ETL frågor kvantifiera hur väl ETL query tekniker utföra datasökning och konvertering . Data kvalitet kan definieras av det totala antalet fel som genereras av frågan . Datakvalitet kan beräknas utifrån noggrannheten hos en data pull baserat på fördefinierade testfall . ETL query övervakningsverktyg spåra den tid som krävs för att generera resultat för en fråga . Den genomsnittliga datahämtning tid eller fråga svarstid kan användas för att övervaka databasens prestanda och kvalitet av frågor . Query tekniker som genererar höga felprocent eller tar längre tid än genomsnittet kan anses vara sämre än de som kör snabbt och smidigt .