Envíanos tu consulta
Términos y condiciones *
*Si no puedes asistir en directo de facilitaremos un enlace para verlo en diferido
logoImagina
iconoCurso

Curso completo de Spark con Python

DISPONIBLE EN MODALIDAD:
Aprende a utilizar Apache Spark, el framework de computación en clúster de código abierto, orientado al procesamiento de datos en tiempo real, que provee de una interfaz para programar clusters con paralelismo de datos implícito y tolerancia a fallos.
iconClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClient
Formación en Spark con Python bonificable para empresas

¿A quién va dirigido?

A todos aquellos desarrolladores que quieran aprender la tecnología de procesamiento de datos en memoria más puntera del mercado.

Objetivos

  • Aprender a utilizar Python con el framework Spark 3x a través de Databricks
  • Aprender a gestionar, preparar y organizar datos
  • Aprender a crear, entrenar y evaluar modelos de ML con Spark
  • Aprender el ciclo de vida del dato y a sacar valor de éstos
  • Aprender a detectar problemas y aplicar buenas prácticas en la gestión de los datos

¿Qué vas a aprender?

Aprende a utilizar Apache Spark, el framework de computación en clúster de código abierto, orientado al procesamiento de datos en tiempo real, que provee de una interfaz para programar clusters con paralelismo de datos implícito y tolerancia a fallos.

Requisitos

  • Tener experiencia desarrollando con Python y realizando consultas SQL
  • Son necesarios permisos de instalación en el equipo en el que se realice la formación
  • Tener acceso (revisar configuraciones proxy en caso de tenerlas) a una cuenta Community de Azure Databricks para realizar los laboraorios de Spark
  • Tener Python 3, Git y un IDE para desarrollar en Python instalado previamente (por ejemplo Pycharm) instalados previamente en el equipo

Temario del curso

tema 1

Introducción

  • ¿Qué es Spark?
  • ¿Qué es Hadoop?
  • ¿Qué es HBase?
  • HDFS
  • Principales comandos de HDFS
  • Instalación de Spark
  • PySpark
  • Funciones esenciales de Python
  • Consola de Spark
  • Acceso a DataBricks
  • Arquitectura
  • Componentes
tema 2

Apache Spark SQL

  • Introducción a Spark SQL
  • Esquemas
  • Operaciones SQL
  • Opciones de Entrada/Salida
  • DataFrames
  • DataSets
  • Uniones
  • Conjuntos de datos fuertemente tipados
  • Uso de conjunto de datos
  • Conversiones
  • Optimizaciones de rendimiento
tema 3

RDD

  • Introducción a los RDD en Spark
  • Creación de un RDD
  • Map
  • Filter
  • Flatmap
  • Cache
  • Persistencia
  • RDDs numérico
tema 4

RDD Clave-Valor

  • Introducción a los RDD Clave-Valor en Spark
  • Creación de RDD Clave-Valor
  • Filter
  • MapValue
  • Reduce By Key
  • Group By Key
  • Sort By Key
  • Particionamiento de datos
  • Operaciones Join
tema 5

Machine Learning con Spark

  • Introducción a MLLib
  • Creación de un sistema de ML
  • Regresión Lineal con MLLib
  • Dataframes con MLLib
tema 6

Clusters

  • Estrategias de replicación
  • Creación de un cluster
  • Lanzamiento de trabajos
  • Monitorización de clusters
  • Particionamiento
tema 7

Despliegue

  • Estructura de los proyectos
  • Despliegue de aplicaciones
  • Empaquetado de aplicaciones
  • Spark-Submit
tema 8

Buenas prácticas

  • Recomendaciones de programación paralela
  • Inmutabilidad
  • Uso de lambdas
  • Bucles
  • Uso de funciones dentro de Dataframes
tema 9

Detección de problemas

  • Planes de ejecución
  • Detectando un Shuffle en un procesamiento
  • Probando operaciones que puedan causar un Shuffle
  • Cambiando el diseño de trabajos con dependencias amplias
  • Usando operaciones keyBy para reducir los Shuffle
  • Usando particionadores personalizado

Curso de Spark con Python bonificado para Empresas a través de FUNDAE

Somos entidad organizadora de FUNDAE, todas nuestras formaciones se pueden bonificar hasta el 100%, sujeto a vuestro crédito disponible y a cumplir con todos los requisitos de realización establecidos por la Fundación Estatal para el Empleo.

 

Si desconoces el funcionamiento de las bonificaciones, ofrecemos el servicio de gestión en FUNDAE, consúltanos cualquier duda que te surja.

Descargar Guía FUNDAE
imagenFundae
iconClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClient