Fakttabellen og dens typer i datawarehousing

Hvad er en faktatabel?

En faktatabel er en central tabel i et stjerneskema i et datawarehouse. Det er et vigtigt begreb, der er nødvendigt for Data Warehousing og BI-certificering. En faktatabel gemmer kvantitative oplysninger til analyse og er ofte denormaliseret. En faktatabel arbejder sammen med dimensionstabeller, og den indeholder de data, der skal analyseres, og en dimensionstabel gemmer data om de måder, hvorpå dataene kan analyseres.

Så består en faktatabel af to typer kolonner. Fremmednøglespalten gør det muligt at forbinde med dimensionstabeller, og målekolonnerne indeholder de data, der analyseres.

Transaktionsfaktatabeller

En transaktionstabel er den mest grundlæggende og fundamentale visning af forretningsaktiviteter. Disse faktatabeller repræsenterer en begivenhed, der fandt sted på et øjeblikkeligt tidspunkt. Der findes kun en række i faktatabellen for en given kunde eller et givet produkt, hvis der er sket en transaktion.

En given kunde eller et givet produkt er sandsynligvis knyttet til flere rækker i faktatabellen, fordi kunden eller produktet er involveret i mere end én transaktion. Transaktionsdata struktureres ofte ret nemt i en dimensionel ramme. Data på laveste niveau er de mest naturlige dimensionsdata og understøtter analyser, der ikke kan foretages på summariske data.

Selv med data på transaktionsniveau er der desværre stadig en hel klasse af presserende forretningsspørgsmål, som det er upraktisk at besvare ved kun at bruge transaktionsdetaljer.

Snapshot Faktatabeller

Denne type faktatabel beskriver tingenes tilstand på et bestemt tidspunkt og indeholder normalt flere semi-additive og ikke-additive fakta. Det andet eksempel, der præsenteres her, er en snapshot-faktatabel.

Eksempel:

Periodiske øjebliksbilleder er nødvendige for at se virksomhedens kumulative resultater med regelmæssige, forudsigelige tidsintervaller. I modsætning til transaktionsfaktartabellen, hvor vi indlæser en række for hver hændelsesforekomst, tager vi med det periodiske øjebliksbillede et billede af aktiviteten ved udgangen af en dag, uge eller måned, derefter endnu et billede ved udgangen af den næste periode osv. Eksempel: Eksempel: En oversigt over en sælgers præstationer i den foregående måned.

Akkumuleret faktatabel

Denne type faktatabel bruges til at vise aktiviteten i en proces, der har en veldefineret begyndelse og afslutning. F.eks. behandlingen af en ordre. En ordre bevæger sig gennem bestemte trin, indtil den er færdigbehandlet. Efterhånden som trinene mod opfyldelse af ordren er afsluttet, opdateres den tilknyttede række i faktatabellen.

Akkumulerende øjebliksbilleder har næsten altid flere datostempler, der repræsenterer de forudsigelige større begivenheder eller faser, der finder sted i løbet af et livsforløb. Ofte er der en ekstra datokolonne, der angiver, hvornår snapshotrækken sidst er blevet opdateret. Da mange af disse datoer ikke er kendt, da faktabellen blev indlæst første gang, må vi bruge surrogatdatonøgler til at håndtere udefinerede datoer.

I skarp kontrast til de andre faktabelletyper besøger vi igen rækker i faktabellen for akkumulerende øjebliksbilleder for at opdatere dem. I modsætning til det periodiske øjebliksbillede, hvor vi holder fast i det tidligere øjebliksbillede, afspejler det akkumulerende øjebliksbillede blot den akkumulerede status og de akkumulerede metrikker. Nogle gange arbejder akkumulerende og periodiske snapshots sammen.

Edureka har et specielt kurateret kursus om Data Warehousing, der hjælper dig med at mestre Fact Tables og andre vigtige koncepter og deres implementeringer. Klik her for at komme i gang.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.