Faktentabelle und ihre Typen im Data Warehousing

Was ist eine Faktentabelle?

Eine Faktentabelle ist eine zentrale Tabelle in einem Sternschema eines Data Warehouse. Sie ist ein wichtiges Konzept, das für die Data Warehousing- und BI-Zertifizierung benötigt wird. Eine Faktentabelle speichert quantitative Informationen für die Analyse und ist oft denormalisiert. Eine Faktentabelle arbeitet mit Dimensionstabellen zusammen und enthält die zu analysierenden Daten, während eine Dimensionstabelle Daten über die Art und Weise speichert, in der die Daten analysiert werden können.

Eine Faktentabelle besteht also aus zwei Arten von Spalten. Die Fremdschlüsselspalte ermöglicht die Verknüpfung mit Dimensionstabellen, und die Messspalten enthalten die Daten, die analysiert werden.

Transaktionsfaktentabellen

Eine Transaktionstabelle ist die grundlegendste und grundlegendste Ansicht der Geschäftsvorgänge. Diese Faktentabellen stellen ein Ereignis dar, das zu einem bestimmten Zeitpunkt eingetreten ist. Eine Zeile in der Faktentabelle für einen bestimmten Kunden oder ein bestimmtes Produkt existiert nur, wenn eine Transaktion stattgefunden hat.

Ein bestimmter Kunde oder ein bestimmtes Produkt ist wahrscheinlich mit mehreren Zeilen in der Faktentabelle verknüpft, weil der Kunde oder das Produkt an mehr als einer Transaktion beteiligt ist. Transaktionsdaten lassen sich oft recht einfach in einem dimensionalen Rahmen strukturieren. Die Daten auf der untersten Ebene sind die natürlichsten dimensionalen Daten, die Analysen unterstützen, die mit zusammengefassten Daten nicht möglich sind.

Leider gibt es auch bei Daten auf Transaktionsebene immer noch eine ganze Reihe dringender Geschäftsfragen, die sich nur mit Transaktionsdetails nicht beantworten lassen.

Snapshot-Faktentabellen

Diese Art von Faktentabellen beschreibt den Zustand der Dinge zu einem bestimmten Zeitpunkt und enthält in der Regel mehr semi-additive und nicht-additive Fakten. Das zweite hier vorgestellte Beispiel ist eine Snapshot-Faktentabelle.

Beispiel: Der Fakt „Tagessalden“ kann über die Dimension „Kunden“, nicht aber über die Dimension „Zeit“ summiert werden.

Periodische Momentaufnahmen werden benötigt, um die kumulierte Leistung des Unternehmens in regelmäßigen, vorhersehbaren Zeitabständen zu sehen. Anders als bei der Transaktionstabelle, bei der für jedes Ereignis eine Zeile geladen wird, wird beim periodischen Snapshot ein Bild der Aktivität am Ende eines Tages, einer Woche oder eines Monats aufgenommen, dann ein weiteres Bild am Ende der nächsten Periode usw. Beispiel: Eine Leistungsübersicht eines Verkäufers über den vergangenen Monat.

Kumulierte Faktentabelle

Diese Art von Faktentabelle wird verwendet, um die Aktivität eines Prozesses zu zeigen, der einen klar definierten Anfang und ein klar definiertes Ende hat. Zum Beispiel die Bearbeitung eines Auftrags. Ein Auftrag durchläuft bestimmte Schritte, bis er vollständig bearbeitet ist. Wenn die Schritte zur Erfüllung des Auftrags abgeschlossen sind, wird die zugehörige Zeile in der Faktentabelle aktualisiert.

Akkumulierende Snapshots haben fast immer mehrere Datumsstempel, die die vorhersehbaren Hauptereignisse oder Phasen darstellen, die im Laufe eines Lebens stattfinden. Oft gibt es eine zusätzliche Datumsspalte, die angibt, wann die Snapshot-Zeile zuletzt aktualisiert wurde. Da viele dieser Daten nicht bekannt sind, wenn die Faktenzeile zum ersten Mal geladen wurde, müssen wir Ersatzdatumsschlüssel verwenden, um mit undefinierten Daten umzugehen.

In scharfem Gegensatz zu den anderen Faktentabellentypen besuchen wir die akkumulierenden Snapshot-Faktentabellenzeilen erneut, um sie zu aktualisieren. Im Gegensatz zum periodischen Snapshot, bei dem wir am vorherigen Snapshot festhalten, spiegelt der akkumulierende Snapshot lediglich den akkumulierten Status und die Metriken wider. Manchmal arbeiten akkumulierende und periodische Snapshots zusammen.

Edureka hat einen speziell kuratierten Kurs über Data Warehousing, der Ihnen helfen wird, Faktentabellen und andere wichtige Konzepte und deren Implementierungen zu beherrschen. Klicken Sie hier, um loszulegen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.