Tabulka faktů a její typy v datovém skladu

Co je to tabulka faktů?

Tabulka faktů je centrální tabulka ve hvězdicovém schématu datového skladu. Jedná se o důležitý koncept potřebný pro certifikaci datových skladů a BI. Tabulka faktů uchovává kvantitativní informace pro analýzu a je často denormalizovaná. Tabulka faktů spolupracuje s tabulkami dimenzí a uchovává data určená k analýze a tabulka dimenzí uchovává údaje o způsobech, jakými lze data analyzovat.

Tabulka faktů se tedy skládá ze dvou typů sloupců. Sloupec cizích klíčů umožňuje spojení s tabulkami dimenzí a sloupce míry obsahují data, která se analyzují.

Tabulky faktů transakcí

Tabulka transakcí je nejzákladnější a nejpodstatnější pohled na obchodní operace. Tyto tabulky faktů představují událost, která nastala v okamžitém časovém okamžiku. Řádek v tabulce faktů pro daného zákazníka nebo produkt existuje pouze v případě, že došlo k transakci.

Daný zákazník nebo produkt je pravděpodobně spojen s více řádky v tabulce faktů, protože zákazník nebo produkt je zapojen do více než jedné transakce. Transakční data jsou často poměrně snadno strukturována do dimenzionálního rámce. Data nejnižší úrovně jsou nejpřirozenějšími dimenzionálními daty a podporují analýzy, které nelze provádět na souhrnných datech.

Naneštěstí i s daty na úrovni transakcí stále existuje celá třída naléhavých obchodních otázek, na které není praktické odpovědět pouze pomocí detailů transakcí.

Snímkové tabulky faktů

Tento typ tabulky faktů popisuje stav věcí v určitém časovém okamžiku a obvykle obsahuje více poloaditivních a neaditivních faktů. Druhým zde uvedeným příkladem je tabulka faktů typu snapshot.

Příklad:

Periodické snímky jsou potřebné pro zobrazení kumulativního výkonu podniku v pravidelných, předvídatelných časových intervalech. Na rozdíl od tabulky transakčních faktů, kde načítáme řádek pro každý výskyt události, u periodického snímku pořizujeme snímek činnosti na konci dne, týdne nebo měsíce, pak další snímek na konci dalšího období atd. Příklad:

Akumulovaná tabulka faktů

Tento typ tabulky faktů se používá k zobrazení činnosti procesu, který má přesně definovaný začátek a konec. Například zpracování objednávky. Objednávka prochází určitými kroky, dokud není plně zpracována. Jakmile jsou kroky směřující k vyřízení objednávky dokončeny, aktualizuje se související řádek v tabulce faktů.

Kumulativní snímky mají téměř vždy více datových razítek, která představují předvídatelné hlavní události nebo fáze, k nimž dochází v průběhu života. Často existuje další sloupec s datem, který udává, kdy byl řádek snímku naposledy aktualizován. Protože mnohá z těchto dat nejsou při prvním načtení řádku faktů známa, musíme použít náhradní datové klíče, abychom se vypořádali s neurčitými daty.

Na rozdíl od ostatních typů tabulek faktů se k řádkům tabulky faktů s kumulativními snímky vracíme, abychom je aktualizovali. Na rozdíl od periodického snímku, kde se držíme předchozího snímku, kumulativní snímek pouze odráží kumulovaný stav a metriky. Někdy kumulativní a periodické snímky fungují ve vzájemné kombinaci.

Edureka má speciálně sestavený kurz Data Warehousing, který vám pomůže zvládnout tabulky faktů a další důležité koncepty a jejich implementace. Klikněte zde a začněte.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.