Ir al contenido principal

Diagrama de temas

    • Extremos de ETL

      Uno de los desafíos del proceso ETL es mantener una fuente autorizada para el conjunto de datos preparado sin interrumpir otras operaciones o crear problemas internos del proyecto. Como se mencionó anteriormente, el equipo de TI puede aprovisionar el acceso a una base de datos en la que almacene los datos. Sin embargo, rara vez el proceso ETL va del punto A al punto B en línea recta sin ningún problema en el camino. Usted puede cometer errores, o simplemente puede querer experimentar diferentes maneras de hacer las cosas. Por lo tanto, es común probar las tareas de ETL en un entorno de desarrollo, especialmente si esas tareas se pueden repetir mediante el uso de scripts. Leer y escribir directamente en una base de datos única no es una buena forma de analizarlo. En su lugar, debe considerar la posibilidad de aprovechar un extremo de ETL.

      Un extremo de ETL hace referencia a un entorno de desarrollo que puede configurar y aprovisionar sobre la marcha para su uso con tareas de ETL. El extremo actúa como una especie de intermediario entre el área de trabajo de programación y la base de datos real. Puede alimentarle los datos de la base de datos para que pueda ejecutar los scripts de forma iterativa, sin tener acceso directo al servidor de backend. Esto le permite ajustar las tareas de ETL y ejecutarlas en muchos tipos diferentes de escenarios. Por ejemplo, puede ejecutar los scripts de limpieza de datos en diferentes representaciones de los mismos datos generales para ver cuál es más compatible. Usted y sus compañeros de equipo no necesitan acceder y actualizar el mismo origen de datos autorizado para trabajar en el proyecto.