Envíanos tu consulta
Términos y condiciones *
logoImagina
Formación
Modalidades
Próximas Convocatorias
Temario
FAQ
Solicitar información
iconoCurso

Curso de Apache Airflow

DISPONIBLE EN MODALIDAD:
aMedidaIcon
Aula Virtual Personalizada
arrowRightDark

Este curso te llevará desde los fundamentos de Apache Airflow hasta la implementación de workflows avanzados. Aprende a diseñar, automatizar y monitorear pipelines de datos en entornos empresariales, integrando herramientas externas y optimizando la ejecución para proyectos complejos.

iconClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClient

Formación en Apache Airflow bonificable para empresas

A quién va dirigido nuestro curso de Apache Airflow

Desarrolladores, ingenieros de datos y administradores que deseen implementar y gestionar flujos de trabajo automatizados con Apache Airflow.

Objetivos de nuestro curso de Apache Airflow

  • Comprender los fundamentos y la arquitectura de Apache Airflow para la orquestación de workflows.
  • Diseñar, implementar y optimizar workflows dinámicos con DAGs en Airflow.
  • Gestionar la ejecución y el monitoreo de tareas en pipelines de datos.
  • Integrar Apache Airflow con sistemas y herramientas externas para soluciones empresariales.
  • Implementar estrategias de escalabilidad, seguridad y rendimiento en entornos productivos.

Qué vas a aprender en nuestro curso de Apache Airflow

Este curso te llevará desde los fundamentos de Apache Airflow hasta la implementación de workflows avanzados. Aprende a diseñar, automatizar y monitorear pipelines de datos en entornos empresariales, integrando herramientas externas y optimizando la ejecución para proyectos complejos.

Requisitos de nuestro curso de Apache Airflow

  • Conocimientos básicos de Python y conceptos de ETL (Extract, Transform, Load).
  • Experiencia previa con sistemas de automatización o pipelines de datos es recomendable.
  • Sistema operativo con Python 3.x instalado y acceso a un gestor de paquetes (pip).
  • Equipo con al menos 8 GB de RAM, procesador de 4 núcleos y 20 GB de espacio libre.
  • Permisos para instalar Apache Airflow y sus dependencias.

Temario del curso de Apache Airflow

tema 1

Introducción a Apache Airflow

  • Historia y evolución de Apache Airflow
  • ¿Qué es la orquestación de workflows y por qué es importante?
  • Principales características de Airflow
  • Componentes clave: DAGs, operadores y ejecutores
  • Casos de uso comunes en la automatización de datos
  • Comparación con otras herramientas de orquestación
  • Beneficios de utilizar Airflow en proyectos empresariales
  • Comunidad y ecosistema de Apache Airflow
  • Instalación inicial de Apache Airflow
  • Exploración de ejemplos prácticos de workflows
iconArrowDown
tema 2

Configuración inicial y entorno de trabajo

  • Instalación de Apache Airflow en sistemas locales y en la nube
  • Configuración de bases de datos para metadatos en Airflow
  • Uso de los ejecutores disponibles: LocalExecutor y CeleryExecutor
  • Configuración del entorno en Docker y Kubernetes
  • Uso del archivo airflow.cfg para personalizar configuraciones
  • Creación y gestión de usuarios y roles en Airflow
  • Ejercicio práctico: Configuración básica de Airflow en un entorno local
  • Solución de problemas comunes durante la instalación
  • Prácticas recomendadas para configurar entornos productivos
  • Gestión de dependencias y paquetes adicionales
iconArrowDown
tema 3

Fundamentos de DAGs (Directed Acyclic Graphs)

  • ¿Qué es un DAG y cómo funciona en Airflow?
  • Estructura básica de un DAG en Python
  • Configuración de tareas (tasks) y dependencias
  • Ejecución secuencial y paralela de tareas
  • Configuración de tiempos y horarios con el Scheduler
  • Ejercicio práctico: Creación de un DAG básico
  • Gestión de fallos y estrategias de reintento
  • Monitoreo de DAGs desde la interfaz de usuario de Airflow
  • Análisis de logs para la depuración de workflows
  • Optimización del diseño de DAGs para entornos complejos
iconArrowDown
tema 4

Operadores en Apache Airflow

  • Introducción a los operadores y sus tipos
  • Uso de BashOperator y PythonOperator para tareas básicas
  • Implementación de sensores para tareas basadas en eventos
  • Uso de operadores predefinidos para bases de datos (MySqlOperator, PostgresOperator)
  • Integración con APIs REST mediante operadores HTTP
  • Creación de operadores personalizados en Python
  • Ejercicio práctico: Configuración de operadores en un DAG
  • Manejo de errores y excepciones en operadores
  • Comparación de operadores predefinidos y personalizados
  • Casos prácticos de uso de operadores avanzados
iconArrowDown
tema 5

Conexiones e integración con herramientas externas

  • Configuración de conexiones en Airflow
  • Uso de Airflow con sistemas de almacenamiento como S3 y GCS
  • Integración con Spark y Hadoop para procesamiento de datos
  • Uso de Airflow para ejecutar scripts en plataformas externas
  • Configuración de pipelines ETL con Airflow y Snowflake
  • Ejercicio práctico: Configuración de una conexión con una base de datos
  • Solución de problemas comunes en integraciones
  • Integración con herramientas de análisis como Tableau
  • Mejores prácticas para gestionar conexiones externas
  • Casos de uso empresariales con múltiples integraciones
iconArrowDown
tema 6

Gestión y monitoreo de tareas

  • Configuración del Scheduler para la ejecución de tareas
  • Monitoreo en tiempo real desde la interfaz de usuario
  • Configuración de alertas y notificaciones en Airflow
  • Uso de SLA (Service Level Agreements) para tareas críticas
  • Ejercicio práctico: Configuración de notificaciones por correo
  • Resolución de conflictos de dependencias en tareas
  • Análisis de rendimiento de tareas con herramientas de monitoreo
  • Configuración avanzada de logs para tareas críticas
  • Gestión de prioridades en la ejecución de tareas
  • Casos prácticos de monitoreo y solución de problemas
iconArrowDown
tema 7

Escalabilidad y despliegue en producción

  • Configuración de Airflow en entornos distribuidos
  • Uso de CeleryExecutor para la ejecución paralela
  • Configuración de Airflow en Kubernetes
  • Escalado automático de recursos para ejecutar DAGs masivos
  • Uso de herramientas de monitoreo como Prometheus y Grafana
  • Ejercicio práctico: Implementación de Airflow en un clúster
  • Optimización del rendimiento en entornos escalables
  • Gestión de recursos en Airflow para proyectos grandes
  • Prácticas recomendadas para despliegues en producción
  • Casos de uso avanzados de escalabilidad
iconArrowDown
tema 8

Seguridad en Apache Airflow

  • Configuración de autenticación y autorización en Airflow
  • Uso de roles y permisos para gestionar el acceso
  • Configuración de conexiones seguras con TLS/SSL
  • Prácticas recomendadas para proteger metadatos y datos sensibles
  • Ejercicio práctico: Configuración de roles y permisos
  • Implementación de medidas de seguridad en DAGs
  • Gestión de accesos externos mediante integraciones seguras
  • Resolución de problemas comunes de seguridad
  • Documentación de políticas de seguridad en Airflow
  • Mejores prácticas para entornos empresariales
iconArrowDown
tema 9

Proyecto final

  • Definición de un caso práctico de automatización de workflows
  • Diseño de un DAG para resolver el caso práctico
  • Configuración de operadores y conexiones necesarias
  • Integración de herramientas externas en el workflow
  • Configuración de monitoreo y notificaciones
  • Optimización y escalado del proyecto para producción
  • Documentación del proyecto para usuarios y desarrolladores
  • Ejercicio práctico: Presentación del proyecto final
  • Evaluación de soluciones alternativas para el caso práctico
  • Retroalimentación y conclusiones del curso
iconArrowDown

Preguntas Frecuentes de Apache Airflow

¿Cuáles son los beneficios de realizar el curso de Apache Airflow?

accordionIcon
El curso de Apache Airflow te proporciona conocimientos completos sobre la orquestación de workflows y su importancia en la automatización de procesos de datos. Aprenderás a diseñar y gestionar DAGs (Directed Acyclic Graphs), a utilizar operadores y a integrarte con herramientas externas, mejorando así la eficiencia y escalabilidad de los proyectos empresariales. Al finalizar, estarás capacitado para optimizar flujos de trabajo complejos y mejorar tus perspectivas laborales en el ámbito de la ingeniería de datos.

¿El curso de Apache Airflow se puede bonificar a través de FUNDAE?

accordionIcon
Sí, el curso de Apache Airflow es bonificable a través de FUNDAE. Las empresas pueden beneficiarse de estas ayudas para la formación de sus empleados, lo cual puede cubrir hasta el 100% del coste del curso, dependiendo de los créditos disponibles. Además, si gestionamos la bonificación, se aplicará un coste adicional del 10% del valor del curso más IVA, también bonificable.

¿En qué modalidad se imparte el curso de Apache Airflow?

accordionIcon
El curso de Apache Airflow se imparte en modalidad de aula virtual personalizada. Esto significa que las clases se llevan a cabo mediante videoconferencia a través de Zoom, permitiendo la interacción en tiempo real con el formador y acceso posterior a las grabaciones. Esta modalidad ofrece flexibilidad a las empresas para adaptar el aprendizaje a sus necesidades específicas.

¿Qué habilidades desarrollaré con el curso de Apache Airflow?

accordionIcon
Con el curso de Apache Airflow, desarrollarás habilidades en la gestión de flujos de trabajo automáticos, el diseño y configuración de DAGs, y el uso avanzado de operadores. También te capacitarás en la integración con herramientas externas como bases de datos o plataformas analíticas, y aprenderás prácticas recomendadas para el despliegue en producción y la mejora de la seguridad de los datos manejados.

¿Cómo puedo inscribirme en el curso de Apache Airflow?

accordionIcon
Puedes inscribirte en el curso de Apache Airflow rellenando el formulario de inscripción disponible en nuestra página web. Asegúrate de proporcionar toda la información requerida para facilitar el proceso de inscripción. Si perteneces a una empresa que desea bonificar el curso, contáctanos para gestionar todo el trámite y aprovechar al máximo las subvenciones disponibles.