Tabela faktów i jej rodzaje w hurtowni danych

Co to jest tabela faktów?

Tabela faktów jest centralną tabelą w schemacie gwiaździstym hurtowni danych. Jest to ważna koncepcja wymagana przy certyfikacji Hurtowni Danych i BI. Tabela faktów przechowuje informacje ilościowe do analizy i często jest denormalizowana. Tabela faktów współpracuje z tabelami wymiarów i przechowuje dane, które mają być analizowane, a tabela wymiarów przechowuje dane o sposobach, w jakie dane mogą być analizowane.

Tak więc tabela faktów składa się z dwóch typów kolumn. Kolumna kluczy obcych umożliwia łączenie z tabelami wymiarów, a kolumny miar zawierają dane, które są analizowane.

Transakcyjne tabele faktów

Tabela transakcji jest najbardziej podstawowym i fundamentalnym widokiem operacji biznesowych. Te tabele faktów reprezentują zdarzenie, które miało miejsce w natychmiastowym punkcie w czasie. Wiersz istnieje w tabeli faktów dla danego klienta lub produktu tylko wtedy, gdy wystąpiła transakcja.

Dany klient lub produkt jest prawdopodobnie powiązany z wieloma wierszami w tabeli faktów, ponieważ klient lub produkt jest zaangażowany w więcej niż jedną transakcję. Dane transakcyjne często są dość łatwo strukturyzowane w ramy wymiarowe. Dane najniższego poziomu są najbardziej naturalnymi danymi wymiarowymi, wspierającymi analizy, których nie można wykonać na danych podsumowujących.

Niestety, nawet w przypadku danych na poziomie transakcji nadal istnieje cała klasa pilnych pytań biznesowych, na które niepraktycznie można odpowiedzieć, używając tylko szczegółów transakcji.

Zrzutowe tabele faktów

Ten typ tabeli faktów opisuje stan rzeczy w konkretnym przypadku w czasie i zwykle zawiera więcej faktów póładdytywnych i nieaddytywnych. Drugi z prezentowanych przykładów to tabela faktów typu snapshot.

Przykład: Fakt dzienne salda może być sumowany przez wymiar klientów, ale nie przez wymiar czasu.

Periodyczne migawki są potrzebne, aby zobaczyć skumulowane wyniki przedsiębiorstwa w regularnych, przewidywalnych odstępach czasu. W przeciwieństwie do tabeli faktów transakcji, w której ładujemy wiersz dla każdego wystąpienia zdarzenia, w przypadku migawek okresowych wykonujemy zdjęcie działalności na koniec dnia, tygodnia lub miesiąca, następnie kolejne zdjęcie na koniec następnego okresu itd. Przykład: Podsumowanie wydajności sprzedawcy w poprzednim miesiącu.

Skumulowana tabela faktów

Ten typ tabeli faktów jest używany do pokazania aktywności procesu, który ma dobrze zdefiniowany początek i koniec. Na przykład, przetwarzanie zamówienia. Zamówienie przechodzi przez określone etapy, aż do jego pełnego przetworzenia. W miarę jak kroki w kierunku realizacji zamówienia są kończone, powiązany wiersz w tabeli faktów jest aktualizowany.

Zrzuty akumulacyjne prawie zawsze mają wiele znaczników daty, reprezentujących przewidywalne główne wydarzenia lub fazy, które mają miejsce w trakcie życia. Często istnieje dodatkowa kolumna daty, która wskazuje, kiedy wiersz migawki został ostatnio zaktualizowany. Ponieważ wiele z tych dat nie jest znanych, gdy wiersz faktu został po raz pierwszy załadowany, musimy użyć zastępczych kluczy daty, aby obsłużyć niezdefiniowane daty.

W ostrym kontraście do innych typów tabel faktów, ponownie odwiedzamy gromadzące się wiersze tabeli faktów snapshot, aby je zaktualizować. W przeciwieństwie do okresowych migawek, gdzie zawieszamy się na poprzedniej migawce, migawka akumulacyjna jedynie odzwierciedla skumulowany status i metryki. Czasami zrzuty akumulacyjne i okresowe działają w połączeniu ze sobą.

Edureka ma specjalnie przygotowany kurs na temat Hurtowni Danych, który pomoże Ci opanować Tabele Faktów i inne ważne koncepcje i ich implementacje. Kliknij tutaj, aby zacząć.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.