Tabela de Fatos e seus tipos em Data Warehousing

O que é uma Tabela de Fatos?

Uma Tabela de Fatos é uma tabela central em um esquema de estrelas de um Data Warehouse. É um conceito importante necessário para o Data Warehousing e Certificação BI. Uma Tabela de Fatos armazena informações quantitativas para análise e é frequentemente desnormalizada. Uma tabela de fatos funciona com tabelas de dimensões e contém os dados a serem analisados e uma tabela de dimensões armazena dados sobre as formas em que os dados podem ser analisados.

Assim, uma tabela de fatos consiste em dois tipos de colunas. A coluna de chaves estrangeiras permite unir com as tabelas de dimensões e as colunas de medidas contêm os dados que estão sendo analisados.

Tabelas de fatos de transação

Uma tabela de transações é a visão mais básica e fundamental das operações de negócios. Estas tabelas de fatos representam um evento que ocorreu em um ponto instantâneo no tempo. Uma linha existe na tabela de fatos para um determinado cliente ou produto somente se uma transação tiver ocorrido.

Um determinado cliente ou produto está provavelmente ligado a várias linhas na tabela de fatos porque o cliente ou produto está envolvido em mais de uma transação. Os dados da transação geralmente são estruturados com bastante facilidade em uma estrutura dimensional. Os dados de nível mais baixo são os dados dimensionais mais naturais, suportando análises que não podem ser feitas em dados resumidos.

Felizmente, mesmo com dados em nível de transação, ainda há toda uma classe de questões de negócios urgentes que são impraticáveis de responder usando apenas detalhes de transação.

Tabelas de fatos

Este tipo de tabela de fatos descreve o estado das coisas em uma determinada instância de tempo, e geralmente inclui mais fatos semi-aditivos e não-aditivos. O segundo exemplo aqui apresentado é uma tabela de fatos instantâneos.

Exemplo: Os fatos de saldos diários podem ser resumidos através da dimensão do cliente mas não através da dimensão do tempo.

Fotos periódicos são necessários para ver o desempenho cumulativo do negócio em intervalos de tempo regulares e previsíveis. Ao contrário da tabela de fatos da transação, onde carregamos uma linha para cada ocorrência de evento, com o instantâneo periódico, tiramos uma foto da atividade no final de um dia, semana ou mês, depois outra foto no final do período seguinte, e assim por diante. Exemplo: Um resumo do desempenho de um vendedor no mês anterior.

Tabela de Fatos Acumulados

Este tipo de tabela de fatos é usada para mostrar a atividade de um processo que tem um início e fim bem definidos. Por exemplo, o processamento de uma ordem. Uma ordem passa por etapas específicas até ser totalmente processada. À medida que os passos para o cumprimento da ordem são concluídos, a linha associada na tabela de fatos é atualizada.

Acumulando instantâneos quase sempre tem múltiplos carimbos de data, representando os principais eventos ou fases previsíveis que ocorrem durante o curso de uma vida. Muitas vezes há uma coluna de datas adicional que indica quando a linha de instantâneos foi atualizada pela última vez. Como muitas dessas datas não são conhecidas quando a linha de fatos foi carregada pela primeira vez, devemos usar chaves de data substituídas para lidar com datas não definidas.

Em contraste com os outros tipos de tabelas de fatos, revisitamos as linhas da tabela de fatos acumulados para atualizá-las. Ao contrário do snapshot periódico, onde nos agarramos ao snapshot anterior, o snapshot acumulado apenas reflecte o estado acumulado e as métricas. Às vezes, instantâneos acumulados e periódicos funcionam em conjunto.

Edureka tem um curso especialmente curado sobre Data Warehousing que irá ajudá-lo a dominar as tabelas de fatos e outros conceitos importantes e suas implementações. Clique aqui para começar.

Deixe uma resposta

O seu endereço de email não será publicado.