Tabla de hechos y sus tipos en Data Warehousing

¿Qué es una tabla de hechos?

Una tabla de hechos es una tabla central en un esquema de estrella de un almacén de datos. Es un concepto importante requerido para la certificación de Data Warehousing y BI. Una tabla de hechos almacena información cuantitativa para el análisis y suele estar desnormalizada. Una tabla de hechos trabaja con tablas de dimensiones y contiene los datos a analizar y una tabla de dimensiones almacena datos sobre las formas en que los datos pueden ser analizados.

Así, una tabla de hechos consta de dos tipos de columnas. La columna de claves externas permite unir con las tablas de dimensiones y las columnas de medidas contienen los datos que se están analizando.

Tablas de hechos de transacciones

Una tabla de transacciones es la visión más básica y fundamental de las operaciones de negocio. Estas tablas de hechos representan un evento que ocurrió en un punto instantáneo en el tiempo. Una fila existe en la tabla de hechos para un determinado cliente o producto sólo si se ha producido una transacción.

Un determinado cliente o producto está probablemente vinculado a múltiples filas en la tabla de hechos porque el cliente o producto está involucrado en más de una transacción. Los datos de las transacciones suelen estructurarse con bastante facilidad en un marco dimensional. Los datos de nivel más bajo son los datos dimensionales más naturales, ya que admiten análisis que no pueden realizarse con datos resumidos.

Desgraciadamente, incluso con los datos de nivel de transacción, sigue habiendo toda una clase de preguntas de negocio urgentes a las que no es práctico responder utilizando sólo el detalle de las transacciones.

Tablas de hechos instantáneos

Este tipo de tabla de hechos describe el estado de las cosas en una instancia particular de tiempo, y normalmente incluye más hechos semiactivos y no aditivos. El segundo ejemplo presentado aquí es una tabla de hechos instantánea.

Ejemplo: El hecho de los saldos diarios se puede sumar a través de la dimensión de los clientes, pero no a través de la dimensión del tiempo.

Las instantáneas periódicas son necesarias para ver el rendimiento acumulado del negocio en intervalos de tiempo regulares y predecibles. A diferencia de la tabla de hechos de transacciones, en la que cargamos una fila por cada ocurrencia de un evento, con la instantánea periódica, tomamos una imagen de la actividad al final de un día, semana o mes, luego otra imagen al final del siguiente período, y así sucesivamente. Ejemplo: Un resumen del rendimiento de un vendedor durante el mes anterior.

Tabla de hechos acumulados

Este tipo de tabla de hechos se utiliza para mostrar la actividad de un proceso que tiene un principio y un final bien definidos. Por ejemplo, el procesamiento de un pedido. Un pedido se mueve a través de pasos específicos hasta que se procesa completamente. A medida que se completan los pasos hacia el cumplimiento de la orden, la fila asociada en la tabla de hechos se actualiza.

Las instantáneas de acumulación casi siempre tienen múltiples marcas de fecha, que representan los eventos o fases principales predecibles que tienen lugar durante el curso de una vida. A menudo hay una columna de fecha adicional que indica cuándo se actualizó la fila de la instantánea por última vez. Dado que muchas de estas fechas no se conocen cuando la fila de hechos se cargó por primera vez, debemos utilizar claves de fecha sustitutas para manejar las fechas indefinidas.

En marcado contraste con los otros tipos de tablas de hechos, volvemos a visitar las filas de tablas de hechos de instantáneas acumuladas para actualizarlas. A diferencia de la instantánea periódica, donde nos aferramos a la instantánea anterior, la instantánea de acumulación simplemente refleja el estado y las métricas acumuladas. A veces, las instantáneas acumulativas y periódicas funcionan conjuntamente.

Edureka tiene un curso especialmente curado sobre Data Warehousing que le ayudará a dominar las Tablas de Hechos y otros conceptos importantes y sus implementaciones. Haga clic aquí para empezar.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.