¿Qué son los Procesos ETL? 

Son parte de la composición de datos es parte fundamental cuya función es facilitar el movimiento de los datos y la transformación de los mismos integrando los distintos sistemas o aplicaciones y fuentes en la organización moderna.

procesos-etl

El término ETL corresponde a la siguiente sigla en inglés:

  • Extract: extraer
  • Transform: transformar
  • Load: cargar

 

 

El proceso se resume en las siguientes tres fases:

Extract (Extraer)

En la primera parte del proceso habrá que extraer y cargar los datos directamente a una Base de Datos o a unas tablas creadas para los datos de paso (conocidas también como staging). Esto supone que este medio servirá solo de manera temporal, por lo que podrá ser limpiado en cada proceso de carga.

La parte interior del proceso de extracción es de analizar los datos y verificar si cumple la estructura que se espera, de no cumplir con lo mencionado es rechazado.

Transform (Transformar)

En esta fase se aplica una serie de reglas de negocio o funciones cuando la información se halla contenida en staging luego se sigue con la elaboración del  proceso  de transformación de los datos, que luego pasaran a la Base de Datos.

Sin embargo algunas fuentes requerirán aplicar de alguna modificación o manipulación de los datos al momento de transformarlas.

Load (Cargar)

La fase de carga es el momento que se tiene todos los datos transformados y son cargados en el sistema de destino. Puede que los datos dependan de los requerimientos de la organización y esto implica un sin fin de acciones.

Terminada esta acción, se pueden limpiar los datos de paso, si se cree conveniente.

etl_input_output

ETL data processing

Características de un proceso ETL

En un proceso ETL hay que saber elegir, para hacerlo con conocimiento de causa es necesario revisar las características más relevantes que debe incluir un software ETL.

Según Gartner, son las siguientes:

  • Conectividad y Capacidad de adaptación
  • Capacidades de entrega de datos
  • Capacidades de transformación de datos
  • Capacidades de Metadatos y Modelado de Datos.
  • Capacidades de diseño y entorno de desarrollo
  • Capacidades de gestión de datos
  • Adaptación a las diferentes plataformas hardware y sistemas operativos existentes.
  • Operaciones y capacidades de administración

Beneficios de las herramientas ETL

La solución más inteligente y eficiente para resolver este complicado problema de diversidad de requisitos para la integración de datos de las empresas, si se quiere lograr la agilidad del negocio pasa por usar alguna de las herramientas ETL.

Técnicas de integración de datos en una solución única y lista para usar.

  • Seguridad en la elaboración de flujos de datos flexibles y heterogéneos.
  • Costes operativos más reducidos.
  • La disminución también de la complejidad