Envíanos tu consulta
Términos y condiciones *
*Si no puedes asistir en directo te facilitaremos un enlace para verlo en diferido
logoImagina
Formación
Modalidades
Próximas Convocatorias
Temario
FAQ
Solicitar información
iconoCurso

Curso de Spark

DISPONIBLE EN MODALIDAD:
aMedidaIcon
Aula Virtual Personalizada
arrowRightDark

Apache Spark es un framework de computación en clúster de código abierto, orientado al procesamiento de datos en tiempo real, que provee de una interfaz para programar clústers con paralelismo de datos implícito y tolerancia a fallos y actualmente es el proyecto de Apache más activo.

En este curso aprenderás a utilizar Spark desde la base para operar sobre datos, conocerás qué son los clusters y cómo trabajar con ellos, qué es el machine learning y a desplegar aplicaciones.

iconClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClient

Formación en Spark bonificable para empresas

A quién va dirigido nuestro curso de Spark

A todos aquellos desarrolladores que quieran aprender la tecnología de procesamiento de datos en memoria más puntera del mercado.

Objetivos de nuestro curso de Spark

  • Aprender a utilizar Scala y Python con el framework Spark 3x a través de Databricks y localmente
  • Aprender los fundamentos de Spark y crear RDDs, DataFrames y DataSets
  • Aprender a gestionar, preparar y organizar datos, además de entender el ciclo de vida del dato
  • Aprender a crear, entrenar y evaluar modelos de ML con Spark
  • Aprender a detectar problemas y aplicar buenas prácticas en la gestión de los datos

Qué vas a aprender en nuestro curso de Spark

Apache Spark es un framework de computación en clúster de código abierto, orientado al procesamiento de datos en tiempo real, que provee de una interfaz para programar clústers con paralelismo de datos implícito y tolerancia a fallos y actualmente es el proyecto de Apache más activo.

En este curso aprenderás a utilizar Spark desde la base para operar sobre datos, conocerás qué son los clusters y cómo trabajar con ellos, qué es el machine learning y a desplegar aplicaciones.

Requisitos de nuestro curso de Spark

  • Tener experiencia desarrollando con Scala o Python y haber realzado consultas SQL
  • Son necesarios permisos de instalación en el equipo en el que se realice la formación
  • Tener acceso (revisar configuraciones proxy en caso de tenerlas) a una cuenta Community de Azure Databricks para realizar los laboraorios de Spark
  • Tener Scala, Python 3 y Git instalados previamente para reproducir ejemplos localmente

Temario del curso de Spark

tema 1

Introducción

iconArrowDown
tema 2

Fundamentos de Spark

iconArrowDown
tema 3

Herramientas de Spark

iconArrowDown
tema 4

DataFrames, SQL y DataSets

iconArrowDown
tema 5

Operaciones estructuradas

iconArrowDown
tema 6

Trabajo con tipos distintos de datos

iconArrowDown
tema 7

Agregaciones y Uniones

iconArrowDown
tema 8

Orígenes de datos

iconArrowDown
tema 9

Apache Spark SQL

iconArrowDown
tema 10

DataSets

iconArrowDown
tema 11

Resilient Distributed DataSets (RDDs)

iconArrowDown
tema 12

RDD Clave-Valor

iconArrowDown
tema 13

GraphX (Solo con Scala)

iconArrowDown
tema 14

Variables compartidas distribuidas

iconArrowDown
tema 15

Ejecuciones de Spark en un Cluster

iconArrowDown
tema 16

Despliegue de aplicaciones Spark

iconArrowDown
tema 17

Monitorización

iconArrowDown
tema 18

Mejoras del rendimiento

iconArrowDown
tema 19

Testing y debugging

iconArrowDown
tema 20

Introducción al Machine Learning con Spark

iconArrowDown
tema 21

Detección de problemas

iconArrowDown
tema 22

Performance Tuning

iconArrowDown
tema 23

Buenas prácticas y especificaciones de lenguajes

iconArrowDown

Preguntas Frecuentes de Spark

¿Cuáles son los beneficios del curso Spark?

accordionIcon
El curso de Spark proporciona una formación integral en procesamiento de grandes volúmenes de datos, permitiendo a los empleados de tu empresa optimizar procesos y mejorar la eficiencia en la gestión de datos. Los beneficios incluyen un conocimiento profundo en el uso de Apache Spark, una herramienta clave en Big Data, así como habilidades prácticas para implementar soluciones de datos robustas y escalables.

¿El curso de Spark se puede bonificar a través de FUNDAE?

accordionIcon
Sí, el curso de Spark se puede bonificar a través de la Fundación Estatal para la Formación en el Empleo (FUNDAE). Esto permite que las empresas recuperen parte del coste del curso mediante los créditos de formación continua disponibles.

¿En qué modalidades se imparte el curso de Spark?

accordionIcon
El curso de Spark se imparte en dos modalidades: modalidad online y aula virtual personalizada. Esto proporciona flexibilidad para que las empresas puedan elegir la opción que mejor se adapte a las necesidades y disponibilidad de sus empleados.

¿Qué habilidades desarrollaré con el curso de Spark?

accordionIcon
Con el curso de Spark, desarrollarás habilidades clave en el procesamiento de datos a gran escala utilizando Apache Spark. Entre las habilidades adquiridas se incluyen la capacidad de manejar grandes volúmenes de datos, realizar análisis complejos, desarrollar algoritmos de Machine Learning y optimizar el rendimiento de los datos en tiempo real.

¿Cómo puedo inscribirme en el curso de Spark?

accordionIcon
Para inscribirte en el curso de Spark, debes rellenar los formularios que aparecen en la página web de Imagina Formación. Una vez completado el formulario, nuestro equipo se pondrá en contacto contigo para finalizar el proceso de inscripción.