Envíanos tu consulta
Términos y condiciones *
logoImagina
Con este curso de Spark ML con Python aprenderás a usar el lenguaje de programación Python para crear modelos de aprendizaje automático y a utilizar la biblioteca de Spark ML para implementar modelos de aprendizaje automático en un entorno de Big Data. Al final del curso, los alumnos tendrán los conocimientos necesarios para comenzar a usar Apache Spark ML con Python en sus puestos de trabajo de manera profesional.
iconClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClient
Aprende Spark ML con Python: Curso completo
¿A quién va dirigido?
Profesionales con experiencia en Python que busquen introducirse profesionalmente en el mundo del Machine Learning a través de Apache Spark ML
Objetivos
  • Introducirse en Spark ML y los conceptos fundamentales del aprendizaje automático.
  • Desarrollar habilidades en el uso de la biblioteca de Spark ML.
  • Aprender a trabajar con modelos de aprendizaje automático supervisado y no supervisado como regresión lineal, árboles de decisión, random forest, support vector machines, k-means clustering, etc.
  • Preparar a los alumnos para comenzar a utilizar Apache Spark ML con Python en sus entornos de trabajo de manera profesional
¿Qué vas a aprender?

Con este curso de Spark ML con Python aprenderás a usar el lenguaje de programación Python para crear modelos de aprendizaje automático y a utilizar la biblioteca de Spark ML para implementar modelos de aprendizaje automático en un entorno de Big Data. Al final del curso, los alumnos tendrán los conocimientos necesarios para comenzar a usar Apache Spark ML con Python en sus puestos de trabajo de manera profesional.

Requisitos
  • Tener experiencia desarrollando con Python y realizando consultas SQL
  • Son necesarios permisos de instalación en el equipo en el que se realice la formación
  • Tener acceso (revisar configuraciones proxy en caso de tenerlas) a una cuenta Community de Azure Databricks para realizar los laboratorios de Spark
  • Disponer de una cuenta de Google con acceso a Google Colab donde poder realizar pruebas de modelos
  • Tener Python 3, Git y un IDE para desarrollar en Python instalado previamente (por ejemplo Pycharm) instalados previamente en el equipo
Temario del curso
tema 1Introducción a PySpark y Spark ML
  • Características principales de PySpark
  • Instalación y configuración de PySpark
  • Utilización de Spark con Python
  • Configuración del entorno de desarrollo
  • Introducción a Spark ML
  • Usos de Spark ML en la actualidad
tema 2Aprendizaje automático con Spark ML
  • Uso de la API ML
  • Entrenamiento de modelos de aprendizaje automático
  • Evaluación de modelos
  • Optimización de parámetros
  • Uso de la API ML para predecir
tema 3Feature engineering
  • Definición de features
  • Preprocesamiento de datos
  • Selección de features
  • Transformación de features
  • Normalización de datos
tema 4Modelos de regresión
  • Regresión lineal
  • Regresión logística
  • Regresión de árbol de decisión
  • Regresión de bosque aleatorio
  • Regresión de boosting
tema 5Modelos de clasificación
  • Clasificación binaria
  • Clasificación multiclase
  • Clasificación de árbol de decisión
  • Clasificación de bosque aleatorio
  • Clasificación de boosting
tema 6Modelos de clustering
  • Clustering K-means
  • Clustering aglomerativo
  • Clustering de densidad
tema 7Matriz de confusión
  • Definición de la matriz de confusión
  • Cálculo de la matriz de confusión
  • Visualización de la matriz de confusión
  • Interpretación de resultados
tema 8Métricas de evaluación
  • Métrica de precisión
  • Métrica de recall
  • Métrica de F-Score
  • Métrica de ROC
  • Métrica de AUC
tema 9Optimización de hiperparámetros
  • Selección de hiperparámetros
  • Uso de GridSearch
  • Uso de RandomizedSearch
  • Uso de Cross Validation
tema 10Modelos de aprendizaje profundo con Spark ML
  • Introducción a los modelos de aprendizaje profundo
  • Redes neuronales convolucionales
  • Redes neuronales recurrentes
  • Redes neuronales profundas
tema 11Modelos avanzados con Spark
  • Modelos de aprendizaje automático en línea
  • Modelos de aprendizaje por refuerzo
  • Modelos de aprendizaje generativo
tema 12Evaluación de modelos
  • Evaluación de los modelos con Spark ML
  • Uso de técnicas de validación cruzada
  • Uso de métricas de evaluación
  • Interpretación de resultados
tema 13Persistencia de modelos
  • Introducción a la persistencia de modelos
  • Uso del modelo para predicciones
  • Guardar y cargar modelos
  • Serialización de modelos
tema 14Uso de librerías
  • Introducción a Scikit-learn
  • Utilización de librerías en Spark
  • Utilización de librerías externas
  • Integración con frameworks
tema 15Proyecto final
  • Definición del proyecto
  • Análisis de los datos
  • Entrenamiento de modelos
  • Evaluación de los modelos
  • Puesta en producción de los modelos

Formación Bonificada para Empresas a través de FUNDAE

Somos entidad organizadora de FUNDAE, todas nuestras formaciones se pueden bonificar hasta el 100%, sujeto a vuestro crédito disponible y a cumplir con todos los requisitos de realización establecidos por la Fundación Estatal para el Empleo.

 

Si desconoces el funcionamiento de las bonificaciones, ofrecemos el servicio de gestión en FUNDAE, consúltanos cualquier duda que te surja.

Descargar Guía FUNDAE
imagenFundae
iconClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClient