Envíanos tu consulta
Términos y condiciones *
*Si no puedes asistir en directo te facilitaremos un enlace para verlo en diferido
logoImagina
Formación
Modalidades
Próximas Convocatorias
Temario
FAQ
Solicitar información
iconoCurso

Curso de Spark SQL con Python para procesos ETL

DISPONIBLE EN MODALIDAD:
aMedidaIcon
Aula Virtual Personalizada
arrowRightDark

El curso se centra en el uso de Spark SQL a través de Python para llevar a cabo tareas de extracción, transformación y carga de datos (ETL). Se abarcarán temas desde conceptos básicos de Spark SQL hasta herramientas de transformación avanzadas y procesamiento de datos en tiempo real. El curso se enfoca en la práctica, con ejercicios guiados y proyectos a lo largo de los cuales los alumnos podrán poner en práctica los conocimientos adquiridos.

Los alumnos aprenderán a extraer estructurados y no estructurados datos de una variedad de fuentes; a manipular y transformar datos en formas complejas; a realizar consultas complejas a través de Spark SQL; a combinar los resultados de estas consultas en una sola respuesta; a limpiar, unir y normalizar los datos; y a procesar datos en tiempo real con herramientas como Kafka. Al concluir el curso, los alumnos estarán preparados para diseñar y desarrollar un proyecto de ETL completo con Spark SQL.

iconClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClient

Formación en Spark SQL con Python para procesos ETL bonificable para empresas

A quién va dirigido nuestro curso de Spark SQL con Python para procesos ETL

Profesionales con experiencia en desarrollo con Python que quieran profundizar en cómo emplearlo para llevar a cabo procesos ETL con PySpark

Objetivos de nuestro curso de Spark SQL con Python para procesos ETL

  • Aprender los conceptos básicos de Spark SQL
  • Practicar el uso de Spark SQL para crear consultas complejas
  • Aprender a combinar los resultados de estas consultas en una sola respuesta
  • Desarrollar habilidades para limpiar, unir y normalizar los datos
  • Comprender cómo procesar datos en tiempo real con herramientas como Kafka

Qué vas a aprender en nuestro curso de Spark SQL con Python para procesos ETL

El curso se centra en el uso de Spark SQL a través de Python para llevar a cabo tareas de extracción, transformación y carga de datos (ETL). Se abarcarán temas desde conceptos básicos de Spark SQL hasta herramientas de transformación avanzadas y procesamiento de datos en tiempo real. El curso se enfoca en la práctica, con ejercicios guiados y proyectos a lo largo de los cuales los alumnos podrán poner en práctica los conocimientos adquiridos.

Los alumnos aprenderán a extraer estructurados y no estructurados datos de una variedad de fuentes; a manipular y transformar datos en formas complejas; a realizar consultas complejas a través de Spark SQL; a combinar los resultados de estas consultas en una sola respuesta; a limpiar, unir y normalizar los datos; y a procesar datos en tiempo real con herramientas como Kafka. Al concluir el curso, los alumnos estarán preparados para diseñar y desarrollar un proyecto de ETL completo con Spark SQL.

Requisitos de nuestro curso de Spark SQL con Python para procesos ETL

  • Tener experiencia desarrollando con Python y realizando consultas SQL
  • Son necesarios permisos de instalación en el equipo en el que se realice la formación
  • Tener acceso (revisar configuraciones proxy en caso de tenerlas) a una cuenta Community de Azure Databricks para realizar los laboratorios de Spark
  • Tener Python 3, Git y un IDE para desarrollar en Python instalado previamente (por ejemplo Pycharm) instalados previamente en el equipo

Temario del curso de Spark SQL con Python para procesos ETL

tema 1

Introducción a Spark SQL

  • Introducción a PySpark
  • PySpark en la actualidad y principales usos en el mundo real
  • Introducción a los procesos ETL
  • Introducción a Spark SQL
  • ¿Cómo funciona Spark SQL?
  • ¿Cuáles son los componentes de Spark SQL?
  • ¿Qué herramientas se usan para usar Spark SQL?
  • Instalación de Spark
  • Configuración de entornos de desarrollo
  • Configuración de Spark
  • Configuración de parámetros de Spark
  • Creación de nuestro primer proyecto PySpark
iconArrowDown
tema 2

Extracción de datos

  • Conexión con bases de datos relacionales
  • Conexión con bases de datos no relacionales
  • Otras conexiones habituales en el mundo real
  • Extracción de datos no estructurados
iconArrowDown
tema 3

Transformaciones de datos en Spark SQL

  • Manipulación y transformación de datos
  • Limpieza, unión y normalización de datos
  • Transformación de datos con DataFrames
  • Transformación de datos con SQL
  • Transformación de datos con funciones de agregación
  • Transformación de datos con funciones de manipulación de cadenas
  • Uso de expresiones regulares
  • Transformación de datos con funciones de manipulación de fechas
  • Scripts de transformación
iconArrowDown
tema 4

Modelado de datos en Spark SQL

  • Definición de esquemas de tablas
  • Carga y almacenamiento de datos
  • Particionamiento de datos
  • Creación de índices
  • Compresión de datos
iconArrowDown
tema 5

Procesos ETL (Extracción, Transformación y Carga) con Spark SQL

  • Diseño de procesos ETL
  • Ejecución de procesos ETL
  • Optimización de procesos ETL
  • Optimización de consultas
  • Uso de funciones de Python en consultas de Spark SQL
  • Monitorización de procesos ETL
  • Pruebas de procesos ETL
iconArrowDown
tema 6

Proceso ETL: Carga de datos

  • Carga de datos en bases de datos relacionales
  • Carga de datos en bases de datos no relacionales
iconArrowDown
tema 7

Consultas de Spark SQL

  • Escribiendo consultas en Spark SQL
  • Diseño de consultas
  • Ejecución de consultas
  • Optimización de consultas
  • Creación de tablas temporales
iconArrowDown
tema 8

Procesos de agregación con Spark SQL

  • Introducción a los procesos de agregación
  • Uso de funciones de agregación
  • Uso de ventanas de agregación
  • Uso de funciones de ventanas
  • Uso de funciones de ranking
iconArrowDown
tema 9

Procesos de unión con Spark SQL

  • Tipos de unión en Spark SQL
  • Uso de unión externa
  • Uso de unión natural
  • Uso de unión cruzada
  • Uso de unión para unir múltiples tablas
iconArrowDown
tema 10

Uso avanzado de Spark SQL

  • Uso de variables de sesión
  • Uso de configuración dinámica
  • Uso de almacenamiento persistente
  • Uso de UDFs (funciones definidas por el usuario)
  • Uso de vistas
iconArrowDown
tema 11

Trabajando con grandes conjuntos de datos en Spark SQL

  • Introducción a los grandes conjuntos de datos
  • Particionamiento de grandes conjuntos de datos
  • Optimización de consultas para grandes conjuntos de datos
  • Uso de configuración avanzada para grandes conjuntos de datos
  • Uso de herramientas de análisis para grandes conjuntos de datos
iconArrowDown
tema 12

Procesamiento de datos en tiempo real

  • Introducción a Kafka
  • Configuración de Kafka
  • Procesamiento de datos con Kafka
iconArrowDown
tema 13

Proyecto final de ETL con Spark SQL

  • Diseño de un proyecto de ETL
  • Desarrollo de un proyecto de ETL
  • Pruebas y depuración de un proyecto de ETL
  • Puesta en producción de un proyecto de ETL
iconArrowDown

Preguntas Frecuentes de Spark SQL con Python para procesos ETL

Beneficios del curso Spark SQL con Python para procesos ETL

accordionIcon
Al tomar este curso, tu empresa podrá acelerar significativamente los procesos de carga y transformación de datos con herramientas como Spark SQL y Python. Esto se traduce en una mejora en la eficiencia operativa y una mayor capacidad para manejar grandes volúmenes de datos.

¿Es el curso Spark SQL con Python para procesos ETL 100% bonificado por FUNDAE?

accordionIcon
Sí, el curso es 100% bonificable a través de FUNDAE. Esto quiere decir que tu empresa puede recuperar el costo del curso mediante las bonificaciones disponibles para la formación de sus trabajadores.

¿Cómo se imparten las clases del curso Spark SQL con Python para procesos ETL?

accordionIcon
Las clases se imparten de manera online a través de una plataforma de formación interactiva. Esto permite a tus empleados acceder al contenido desde cualquier lugar y en el horario que mejor se adapte a sus necesidades.

¿Qué habilidades desarrollarán los empleados al tomar el curso Spark SQL con Python para procesos ETL?

accordionIcon
Los empleados desarrollarán habilidades avanzadas en el uso de Spark SQL y Python específicamente orientadas a procesos ETL (Extract, Transform, Load). Esto incluye manejo de grandes volúmenes de datos, optimización de consultas y procesamiento eficiente de datos.

¿Cómo me inscribo en el curso Spark SQL con Python para procesos ETL?

accordionIcon
Para inscribirte, simplemente sigue el proceso de registro en nuestra página web. Deberás proporcionar la información necesaria y elegir el método de pago o bonificación que prefieras. Una vez completado, recibirás los detalles para acceder al curso.