Envíanos tu consulta
Términos y condiciones *
*Si no puedes asistir en directo te facilitaremos un enlace para verlo en diferido
logoImagina
Formación
Modalidades
Próximas Convocatorias
Temario
FAQ
Solicitar información
iconoCurso

Curso de Análisis Exploratorio de Datos

DISPONIBLE EN MODALIDAD:
aMedidaIcon
Aula Virtual Personalizada
arrowRightDark

En este curso te sumergirás en el análisis exploratorio de datos (EDA), una fase crucial en cualquier proyecto de ciencia de datos. Aprenderás a limpiar, transformar y visualizar grandes volúmenes de datos, aplicando técnicas estadísticas descriptivas, identificación de outliers y análisis multivariado. Usarás herramientas populares como Python y R, explorando sus capacidades de visualización y manipulación de datos. El curso concluye con un proyecto donde aplicarás todo lo aprendido a un dataset real.

iconClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClient

Formación en Análisis Exploratorio de Datos bonificable para empresas

A quién va dirigido nuestro curso de Análisis Exploratorio de Datos

Científicos de datos, analistas y profesionales interesados en mejorar sus habilidades en el análisis exploratorio de datos.

Objetivos de nuestro curso de Análisis Exploratorio de Datos

  • Realizar análisis exploratorios utilizando Python y R.
  • Aplicar técnicas avanzadas de limpieza y transformación de datos.
  • Visualizar datos univariados y multivariados para obtener insights.
  • Implementar análisis estadístico descriptivo y correlacional.
  • Completar un proyecto de análisis de datos de principio a fin.

Qué vas a aprender en nuestro curso de Análisis Exploratorio de Datos

En este curso te sumergirás en el análisis exploratorio de datos (EDA), una fase crucial en cualquier proyecto de ciencia de datos. Aprenderás a limpiar, transformar y visualizar grandes volúmenes de datos, aplicando técnicas estadísticas descriptivas, identificación de outliers y análisis multivariado. Usarás herramientas populares como Python y R, explorando sus capacidades de visualización y manipulación de datos. El curso concluye con un proyecto donde aplicarás todo lo aprendido a un dataset real.

Requisitos de nuestro curso de Análisis Exploratorio de Datos

  • Tener experiencia con los fundamentos de Python R y la estadística
  • Instalaciones previas: Python (v3 o superior), Anaconda, R y RStudio (última versión estable)
  • Tener un equipo con acceso a un usuario con permisos de instalación, conexión estable a Internet, mínimo 8GB de RAM y mínimo 20GB de memoria en disco libres.

Temario del curso de Análisis Exploratorio de Datos

tema 1

Introducción a la Exploratory Data Analysis (EDA)

  • Concepto de Exploratory Data Analysis (EDA)
  • Importancia del EDA en la ciencia de datos
  • Diferencias entre EDA y análisis estadístico descriptivo
  • Aplicaciones comunes del EDA en proyectos de ciencia de datos
  • Principales herramientas y librerías utilizadas para EDA
  • Relación entre EDA y la preparación de datos
  • Etapas del EDA: desde la comprensión de los datos hasta la visualización
  • Casos de uso de EDA en la industria
  • Limitaciones del EDA
  • Ejemplos prácticos de EDA en datasets reales
iconArrowDown
tema 2

Conociendo los Datos: Carga y Preprocesamiento

  • Importancia de conocer los datos antes de analizarlos
  • Carga de datos desde archivos CSV, Excel, SQL, etc.
  • Uso de librerías como Pandas para la manipulación de datos
  • Identificación de tipos de variables: categóricas y numéricas
  • Gestión de valores faltantes (NaN) en los datos
  • Detección de duplicados en el dataset
  • Ejemplo práctico: Preprocesamiento de un dataset financiero
  • Normalización y estandarización de los datos
  • Conversión de tipos de datos y manejo de fechas
  • Mejores prácticas para la limpieza de datos
iconArrowDown
tema 3

Análisis Estadístico Descriptivo

  • Conceptos básicos del análisis estadístico descriptivo
  • Medidas de tendencia central: media, mediana y moda
  • Medidas de dispersión: desviación estándar, varianza y rango
  • Identificación de outliers en los datos
  • Análisis de correlaciones entre variables numéricas
  • Ejemplo práctico: Análisis estadístico de un dataset de ventas
  • Uso de Pandas y NumPy para cálculos estadísticos
  • Creación de resúmenes estadísticos para variables numéricas
  • Interpretación de estadísticas descriptivas
  • Aplicación del análisis descriptivo en la toma de decisiones
iconArrowDown
tema 4

Visualización de Datos: Introducción y Herramientas

  • Importancia de la visualización en el EDA
  • Introducción a las principales herramientas de visualización: Matplotlib y Seaborn
  • Diferencia entre visualizaciones univariadas y multivariadas
  • Gráficos básicos: histogramas, gráficos de barras y boxplots
  • Ejemplo práctico: Creación de gráficos con Matplotlib
  • Mejores prácticas para visualizar datos correctamente
  • Selección de visualizaciones adecuadas para diferentes tipos de datos
  • Uso de Palettes y temas en Seaborn para gráficos personalizados
  • Exportación de gráficos a formatos como PNG y PDF
  • Casos de uso de visualizaciones en la industria
iconArrowDown
tema 5

Visualización de Datos Univariada

  • Concepto de visualización univariada
  • Creación de histogramas para analizar distribuciones
  • Boxplots para identificar outliers y dispersión
  • Gráficos de densidad para visualizar la probabilidad de ocurrencia
  • Ejemplo práctico: Visualización univariada de un dataset de salud
  • Análisis de datos categóricos con gráficos de barras
  • Uso de gráficos de violín para comparar distribuciones
  • Interpretación de gráficos univariados en el contexto del análisis
  • Comparación de diferentes métodos de visualización univariada
  • Limitaciones y desafíos en la visualización univariada
iconArrowDown
tema 6

Visualización de Datos Multivariada

  • Concepto de visualización multivariada
  • Uso de scatter plots para observar relaciones entre dos variables
  • Pair plots para analizar múltiples variables de manera simultánea
  • Heatmaps para visualizar matrices de correlación
  • Ejemplo práctico: Visualización multivariada en un dataset de clima
  • Uso de gráficos de burbuja para agregar una tercera dimensión a los datos
  • Interpretación de relaciones entre variables numéricas y categóricas
  • Casos de uso de visualizaciones multivariadas en la ciencia de datos
  • Análisis de interacción entre múltiples variables
  • Limitaciones y posibles errores en la interpretación de gráficos multivariados
iconArrowDown
tema 7

Análisis de Correlaciones y Relaciones entre Variables

  • Concepto de correlación en el análisis de datos
  • Matrices de correlación y su interpretación
  • Uso de Seaborn para crear heatmaps de correlación
  • Identificación de relaciones lineales y no lineales
  • Ejemplo práctico: Análisis de correlación en un dataset de precios de casas
  • Importancia de entender las relaciones entre variables antes de modelar
  • Uso de gráficos de dispersión para observar correlaciones
  • Limitaciones del análisis de correlación
  • Detección de correlaciones espurias y su impacto en el análisis
  • Estrategias para interpretar correctamente las correlaciones
iconArrowDown
tema 8

Análisis de Outliers y Valores Anómalos

  • Concepto de outliers y su impacto en el análisis de datos
  • Métodos para detectar outliers: Z-Score y IQR (Interquartile Range)
  • Visualización de outliers con boxplots y scatter plots
  • Ejemplo práctico: Detección de outliers en un dataset de ingresos
  • Impacto de los outliers en modelos predictivos
  • Estrategias para manejar outliers en datasets
  • Uso de técnicas de escalado para reducir el impacto de outliers
  • Decisiones sobre la eliminación o retención de outliers
  • Casos de uso de detección de outliers en la industria
  • Mejores prácticas para gestionar valores anómalos
iconArrowDown
tema 9

Análisis de Series Temporales

  • Introducción al análisis de series temporales
  • Diferencia entre datos estáticos y series temporales
  • Ejemplo práctico: Análisis de una serie temporal de ventas
  • Identificación de patrones: estacionalidad y tendencia
  • Uso de gráficos de líneas para visualizar series temporales
  • Descomposición de series temporales en componentes
  • Aplicación de técnicas de suavizado para series temporales
  • Uso de Pandas para manipular y visualizar series temporales
  • Detección de anomalías en series temporales
  • Casos de uso de series temporales en predicciones financieras y de demanda
iconArrowDown
tema 10

Transformaciones de Datos

  • Importancia de transformar datos en el EDA
  • Métodos comunes de transformación: logaritmos, raíz cuadrada y Box-Cox
  • Ejemplo práctico: Transformación de datos sesgados
  • Normalización y estandarización de variables
  • Uso de transformaciones para mejorar la interpretación de gráficos
  • Efectos de las transformaciones en la distribución de datos
  • Estrategias para seleccionar la mejor transformación
  • Casos de uso de transformaciones en modelos de machine learning
  • Impacto de las transformaciones en la calidad del análisis
  • Mejores prácticas para aplicar transformaciones de datos
iconArrowDown
tema 11

Análisis de Componentes Principales (PCA)

  • Introducción al análisis de componentes principales (PCA)
  • Concepto de reducción de dimensionalidad en datasets grandes
  • Ejemplo práctico: Implementación de PCA en un dataset de marketing
  • Uso de PCA para identificar patrones en datos multivariados
  • Visualización de los componentes principales
  • Evaluación de la varianza explicada por los componentes principales
  • Casos de uso de PCA en la ciencia de datos
  • Impacto de PCA en la simplificación de modelos
  • Limitaciones y desafíos del PCA en análisis exploratorio
  • Estrategias para interpretar los resultados del PCA
iconArrowDown
tema 12

Feature Engineering en el EDA

  • Concepto de Feature Engineering y su relevancia en el análisis de datos
  • Creación de nuevas variables a partir de datos existentes
  • Ejemplo práctico: Feature Engineering en un dataset de clientes
  • Selección de características relevantes para modelos predictivos
  • Uso de técnicas de binning y polinomial para mejorar predicciones
  • Identificación de relaciones no lineales mediante nuevas características
  • Mejores prácticas para Feature Engineering en proyectos de ciencia de datos
  • Impacto del Feature Engineering en la precisión de los modelos
  • Casos de éxito en la industria con Feature Engineering
  • Estrategias para automatizar el Feature Engineering en grandes datasets
iconArrowDown
tema 13

Análisis Exploratorio de Texto

  • Introducción al análisis exploratorio de datos no estructurados
  • Técnicas de procesamiento de lenguaje natural (NLP) para análisis de texto
  • Ejemplo práctico: Exploración de un dataset de comentarios de clientes
  • Uso de WordClouds para la visualización de texto
  • Análisis de frecuencia de palabras y n-grams
  • Limpieza de datos de texto: tokenización, stopwords y lematización
  • Identificación de sentimientos en datos textuales
  • Casos de uso de análisis de texto en marketing y servicio al cliente
  • Limitaciones del análisis de texto no estructurado
  • Mejores prácticas para la visualización y análisis de texto
iconArrowDown
tema 14

Herramientas Avanzadas para EDA: Python y R

  • Comparación entre Python y R para análisis exploratorio
  • Introducción a librerías avanzadas de EDA en Python: Pandas, Matplotlib, Seaborn
  • Ejemplo práctico: EDA con Python en un dataset de ventas
  • Uso de R para análisis estadístico y visualización de datos
  • Ejemplo práctico: EDA con R en un dataset de encuestas
  • Comparación de las capacidades de visualización de Python y R
  • Estrategias para seleccionar la mejor herramienta para EDA
  • Integración de Python y R en el mismo análisis
  • Casos de éxito en la industria usando Python y R
  • Limitaciones y ventajas de cada lenguaje en proyectos de EDA
iconArrowDown
tema 15

Proyecto Final: Análisis Exploratorio Completo

  • Selección de un dataset complejo para el análisis
  • Ejecución de una limpieza de datos avanzada
  • Creación de visualizaciones univariadas y multivariadas
  • Análisis estadístico descriptivo y correlacional del dataset
  • Detección y manejo de outliers y valores faltantes
  • Aplicación de transformaciones de datos y PCA
  • Feature Engineering y creación de nuevas variables
  • Implementación de visualizaciones avanzadas con Python y R
  • Presentación de hallazgos y conclusiones del análisis
  • Evaluación y entrega del proyecto final
iconArrowDown