Capacita a tu equipo en Data Science con Python A Medida, con Pandas y Scikit-learn, tutorizado y bonificable por FUNDAE para empresas, aplicado. Contáctanos.
Conecta análisis técnico con valor de negocio Cada bloque está orientado a tomar mejores decisiones: definir métricas, entender errores, comunicar resultados, priorizar acciones y evitar modelos que no aportan valor real.
1
Mejora reproducibilidad y calidad La formación
Personaliza el temario al 100% para tu equipo
Diseñamos una formación a medida utilizando los documentos y flujos de trabajo reales de tu empresa.
Nueva Plataforma de E-learningFormación en directo con plataforma de apoyo para reforzar el aprendizaje
Acceso a las grabaciones
Los alumnos podrán revisar las sesiones grabadas para repasar conceptos clave, recuperar explicaciones concretas o reforzar aquellos contenidos que necesiten después de la clase en directo.
Recursos formativos
Materiales, sesiones grabadas y documentación de apoyo quedan centralizados en la plataforma para que el equipo pueda consultarlos durante y después de la formación.
Confirmación de asistencia
La plataforma permite registrar y confirmar la asistencia de los participantes, facilitando el seguimiento de la formación y la gestión documental necesaria para la bonificación FUNDAE.
Programa formativo
Temario del curso
Encuentra todo el temario del curso aquí.
Temario
¿Qué es Data Science y cómo combina programación, estadística, negocio, visualización, machine learning, ingeniería de datos y comunicación?
¿Para qué sirve Python en Data Science cuando la empresa ya trabaja con Excel, BI, SQL, ERP, CRM, data warehouses o plataformas cloud?
¿Qué diferencia hay entre análisis descriptivo, diagnóstico, predictivo, prescriptivo y generación de soluciones basadas en IA?
¿Cuándo tiene sentido crear un modelo predictivo y cuándo basta con una regla de negocio, un dashboard o una consulta SQL bien diseñada?
¿Qué roles intervienen en un proyecto real: negocio, analista, data scientist, data engineer, IT, seguridad, legal y dirección?
Identificar casos de uso frecuentes: predicción de demanda, churn, segmentación, fraude, clasificación de tickets, mantenimiento predictivo y forecast.
Reconocer riesgos habituales: datos incompletos, sesgos, fuga de información, modelos opacos, métricas mal elegidas y conclusiones sin contexto.
Entender el flujo completo de trabajo: pregunta de negocio, datos, exploración, preparación, modelado, evaluación, despliegue y seguimiento.
Definir criterios de éxito antes de empezar: métrica de negocio, métrica técnica, coste de error, usuario final y decisión que se quiere mejorar.
Crear un mapa inicial de proyecto de Data Science con problema, datos disponibles, hipótesis, limitaciones, entregables y riesgos.
¿Qué es Data Science y cómo combina programación, estadística, negocio, visualización, machine learning, ingeniería de datos y comunicación?
¿Para qué sirve Python en Data Science cuando la empresa ya trabaja con Excel, BI, SQL, ERP, CRM, data warehouses o plataformas cloud?
¿Qué diferencia hay entre análisis descriptivo, diagnóstico, predictivo, prescriptivo y generación de soluciones basadas en IA?
¿Cuándo tiene sentido crear un modelo predictivo y cuándo basta con una regla de negocio, un dashboard o una consulta SQL bien diseñada?
¿Qué roles intervienen en un proyecto real: negocio, analista, data scientist, data engineer, IT, seguridad, legal y dirección?
Identificar casos de uso frecuentes: predicción de demanda, churn, segmentación, fraude, clasificación de tickets, mantenimiento predictivo y forecast.
Reconocer riesgos habituales: datos incompletos, sesgos, fuga de información, modelos opacos, métricas mal elegidas y conclusiones sin contexto.
Entender el flujo completo de trabajo: pregunta de negocio, datos, exploración, preparación, modelado, evaluación, despliegue y seguimiento.
Definir criterios de éxito antes de empezar: métrica de negocio, métrica técnica, coste de error, usuario final y decisión que se quiere mejorar.
Crear un mapa inicial de proyecto de Data Science con problema, datos disponibles, hipótesis, limitaciones, entregables y riesgos.
Tema 1: ¿Qué es Data Science con Python y cuándo aporta valor en la empresa?
¿Qué es Data Science y cómo combina programación, estadística, negocio, visualización, machine learning, ingeniería de datos y comunicación?
¿Para qué sirve Python en Data Science cuando la empresa ya trabaja con Excel, BI, SQL, ERP, CRM, data warehouses o plataformas cloud?
¿Qué diferencia hay entre análisis descriptivo, diagnóstico, predictivo, prescriptivo y generación de soluciones basadas en IA?
¿Cuándo tiene sentido crear un modelo predictivo y cuándo basta con una regla de negocio, un dashboard o una consulta SQL bien diseñada?
¿Qué roles intervienen en un proyecto real: negocio, analista, data scientist, data engineer, IT, seguridad, legal y dirección?
Identificar casos de uso frecuentes: predicción de demanda, churn, segmentación, fraude, clasificación de tickets, mantenimiento predictivo y forecast.
Reconocer riesgos habituales: datos incompletos, sesgos, fuga de información, modelos opacos, métricas mal elegidas y conclusiones sin contexto.
Entender el flujo completo de trabajo: pregunta de negocio, datos, exploración, preparación, modelado, evaluación, despliegue y seguimiento.
Definir criterios de éxito antes de empezar: métrica de negocio, métrica técnica, coste de error, usuario final y decisión que se quiere mejorar.
Crear un mapa inicial de proyecto de Data Science con problema, datos disponibles, hipótesis, limitaciones, entregables y riesgos.
Tema 2: Entorno profesional de trabajo con Python, Jupyter, VS Code y Git
Instalar y configurar Python con entornos aislados para evitar conflictos de dependencias entre proyectos.
Comparar uv, conda, venv y pip como opciones de gestión de entornos, paquetes y reproducibilidad.
Preparar JupyterLab para análisis exploratorio, prototipado, documentación viva y comunicación técnica.
Configurar Visual Studio Code para notebooks, scripts, depuración, linting, formateo, tests y control de versiones.
Crear una estructura de proyecto limpia con carpetas para datos, notebooks, código fuente, modelos, informes, configuración y documentación.
Versionar el proyecto con Git, evitando subir datasets grandes, credenciales, salidas temporales o información sensible.
Gestionar dependencias con `pyproject.toml`, `requirements.txt`, `environment.yml` o herramientas corporativas.
Separar notebooks exploratorios de código reutilizable para que el análisis no dependa de celdas ejecutadas manualmente.
Documentar instalación, ejecución, fuentes de datos, parámetros, resultados y decisiones técnicas del proyecto.
Preparar una plantilla corporativa de proyecto Data Science lista para reutilizar en nuevos análisis.
Tema 3: Python aplicado a Data Science: fundamentos útiles y código mantenible
Trabajar con tipos de datos, listas, tuplas, diccionarios, conjuntos, strings, fechas y estructuras anidadas.
Crear funciones claras, pequeñas y reutilizables para limpieza, transformación, validación, cálculo de métricas y generación de informes.
Usar comprensión de listas, generadores e iteradores cuando aportan legibilidad y eficiencia.
Manejar errores con excepciones controladas, mensajes útiles y validaciones antes de procesar datos.
Leer y escribir archivos CSV, JSON, Excel, Parquet y texto plano con control de codificación, separadores y formatos.
Aplicar expresiones regulares para extraer, normalizar o validar patrones en datos textuales.
Organizar código en módulos, paquetes y scripts ejecutables para evitar notebooks imposibles de mantener.
Usar logging en lugar de prints cuando el análisis pasa a automatización, API o proceso programado.
Incorporar type hints y docstrings para mejorar claridad, revisión y mantenimiento del código.
Crear utilidades reutilizables para carga de datos, limpieza básica, validación de columnas y generación de reportes.
Tema 4: NumPy y computación numérica eficiente
Comprender arrays, dimensiones, shapes, dtypes y operaciones vectorizadas como base del cálculo científico en Python.
Crear arrays desde listas, rangos, distribuciones aleatorias, ficheros y resultados de otros procesos.
Aplicar indexación, slicing, máscaras booleanas y broadcasting para transformar datos sin bucles innecesarios.
Calcular estadísticos, agregaciones, operaciones matemáticas, álgebra lineal y transformaciones numéricas.
Gestionar valores especiales como `NaN`, infinitos, máscaras y conversiones de tipo de dato.
Evitar operaciones ineficientes cuando un cálculo puede resolverse de forma vectorizada.
Medir uso de memoria y rendimiento al trabajar con arrays grandes o simulaciones numéricas.
Conectar NumPy con pandas, scikit-learn, SciPy, Matplotlib y librerías de deep learning.
Generar datos sintéticos para probar modelos, validar funciones y crear escenarios reproducibles.
Construir un módulo de cálculo numérico para métricas, simulaciones, transformaciones y validaciones de datos.
Tema 5: pandas moderno: DataFrames, Copy-on-Write, limpieza y análisis tabular
Trabajar con Series y DataFrames como estructuras centrales para análisis de datos tabulares.
Importar datos desde CSV, Excel, JSON, Parquet, SQL y APIs, controlando tipos, fechas, nulos y codificación.
Aplicar selección, filtrado, ordenación, creación de columnas, asignaciones seguras y transformaciones encadenadas.
Entender el comportamiento moderno de pandas con Copy-on-Write y evitar patrones ambiguos de modificación de datos.
Gestionar valores nulos, duplicados, outliers, formatos inconsistentes, columnas mal tipadas y categorías poco fiables.
Usar `groupby`, agregaciones, ventanas, pivot tables, joins, merges y concatenaciones para análisis de negocio.
Trabajar con fechas, calendarios, periodos, zonas horarias, ventanas temporales y frecuencias.
Optimizar memoria mediante categorías, tipos numéricos adecuados, lectura por chunks y formatos columnares.
Crear pipelines de transformación claros, auditables y repetibles usando funciones y pasos documentados.
Preparar un dataset limpio, validado y enriquecido a partir de fuentes heterogéneas de laboratorio.
Tema 6: Polars, PyArrow y DuckDB para datos grandes y análisis rápido
Identificar cuándo pandas es suficiente y cuándo conviene usar Polars, PyArrow o DuckDB por volumen, rendimiento o consultas SQL.
Trabajar con formatos columnares como Parquet para reducir espacio, acelerar lectura y conservar tipos de datos.
Usar Polars en modo eager y lazy para transformar datos con expresiones eficientes y planes optimizados.
Consultar archivos CSV, Parquet y datasets locales con DuckDB sin cargarlo todo manualmente en memoria.
Combinar SQL y Python para análisis exploratorio, agregaciones, joins, filtros y extracción de subconjuntos.
Diseñar flujos híbridos donde DuckDB filtra y agrega, Polars transforma rápido y pandas se usa para compatibilidad analítica.
Evitar cargar datasets completos si el análisis puede resolverse con proyección de columnas, filtros y particionado.
Gestionar particiones por fecha, cliente, producto o región para mejorar rendimiento y mantenibilidad.
Comparar tiempos, memoria y claridad entre pandas, Polars y DuckDB en un mismo caso de negocio.
Construir un pipeline analítico sobre datos en Parquet con consultas SQL, transformaciones lazy y salida preparada para modelado.
Tema 7: Calidad del dato, limpieza avanzada y validación
Definir reglas de calidad: completitud, unicidad, validez, consistencia, precisión, integridad referencial y actualidad.
Detectar datos faltantes, duplicados, outliers, formatos incorrectos, categorías inconsistentes y relaciones imposibles.
Crear validaciones automáticas para columnas obligatorias, rangos permitidos, claves únicas, fechas coherentes y dominios controlados.
Aplicar imputación de valores nulos según contexto: media, mediana, moda, modelos, reglas de negocio o categoría “desconocido”.
Diferenciar cuándo tiene sentido usar deep learning frente a modelos clásicos de scikit-learn.
Crear modelos básicos de clasificación y regresión con Keras o PyTorch sobre datasets tabulares, texto o imágenes sencillas.
Usar GPU cuando esté disponible, entendiendo memoria, batches, tiempos de entrenamiento y limitaciones del entorno.
Aplicar técnicas de regularización como dropout, early stopping, weight decay, normalización y data augmentation cuando proceda.
Monitorizar entrenamiento mediante curvas de pérdida, métricas, overfitting, underfitting y comportamiento por época.
Reutilizar modelos preentrenados para transferencia de aprendizaje en visión, texto o embeddings.
Evitar redes neuronales complejas si el dataset es pequeño, poco limpio o no justifica el coste de entrenamiento.
Documentar arquitectura, hiperparámetros, dataset, métricas, hardware y limitaciones del modelo.
Construir un modelo deep learning sencillo con validación, comparación frente a baseline y análisis de errores.
Tema 18: MLOps, experimentación, despliegue y monitorización de modelos
Registrar experimentos con parámetros, métricas, artefactos, datasets, código, modelos y resultados comparables.
Usar MLflow o herramientas equivalentes para tracking, evaluación, empaquetado y gestión del ciclo de vida del modelo.
Versionar datasets, features, modelos, notebooks, scripts y configuraciones para poder reproducir resultados.
Crear APIs con FastAPI para exponer modelos como servicios internos con validación de entrada y respuesta estructurada.
Crear aplicaciones de demostración con Streamlit o Gradio para validar modelos con usuarios de negocio.
Empaquetar soluciones con Docker cuando se necesita portabilidad, despliegue controlado y separación de dependencias.
Monitorizar modelos en producción con métricas de rendimiento, latencia, errores, drift de datos y drift de predicción.
Definir procesos de retraining, rollback, revisión humana, aprobación y retirada de modelos obsoletos.
Evitar desplegar modelos sin alertas, logs, métricas, documentación, owner y plan de soporte.
Construir un flujo MLOps completo con experimento registrado, modelo empaquetado, API, demo, métricas y plan de monitorización.
Tema 19: Proyecto final: solución completa de Data Science con Python
Seleccionar un caso de negocio realista: churn, demanda, fraude, tickets, ventas, inventario, satisfacción, finanzas o mantenimiento.
Definir pregunta de negocio, usuarios finales, decisión a mejorar, coste del error, métrica de éxito y limitaciones.
Preparar fuentes de datos en CSV, Parquet, SQL o API, documentando origen, calidad, cobertura, permisos y riesgos.
Crear EDA completo con análisis estadístico, visualizaciones, hipótesis, anomalías, segmentos y hallazgos principales.
Construir pipeline de limpieza, validación, feature engineering y división de datos sin fuga de información.
Entrenar varios modelos, comparar baseline, seleccionar métrica principal y ajustar hiperparámetros con validación correcta.
Explicar resultados con interpretabilidad, análisis de errores, segmentos débiles, limitaciones y recomendaciones de uso.
Desplegar una demo o API básica que permita probar predicciones, visualizar resultados y revisar casos concretos.
Crear documentación técnica y ejecutiva con arquitectura, datos, modelo, métricas, riesgos, privacidad y próximos pasos.
Presentar el proyecto final con storytelling, impacto de negocio, evidencias, decisiones, plan de despliegue y mejora continua.
Perfiles profesionales
Pensado para quienes deben dominar Data Science con Python en su día a día
Analistas de datos y perfiles BI
Este curso encaja con analistas que ya trabajan con Excel, SQL, Power BI, Looker, Tableau u otras herramientas de reporting y quieren dar el salto a Python para automatizar análisis, limpiar datos, crear modelos predictivos y mejorar la calidad de sus informes. Aprenderán a trabajar con datasets reales, métricas, visualización, estadística y machine learning aplicado.
Desarrolladores y perfiles técnicos
Los desarrolladores podrán incorporar capacidades de Data Science a aplicaciones, APIs, procesos internos, automatizaciones y productos digitales. El curso les ayudará a entender pipelines de datos, modelos, notebooks, evaluación, despliegue, APIs, dependencias, control de versiones y buenas prácticas para no tratar los modelos como scripts aislados.
Preguntas frecuentes
Resolvemos todas tus dudas sobre nuestra formación en Data Science con Python
Explora las respuestas a las preguntas que guian a nuestra comunidad. Aqui encontraras claridad sobre como funciona todo, desde el acceso hasta los detalles de los cursos. Si buscas respuestas, este es el lugar para comenzar.
Es un curso corporativo avanzado, pero empieza ordenando conceptos fundamentales. Es adecuado para perfiles con base técnica o analítica que quieran trabajar Data Science con Python de forma profesional.
Conviene tener nociones básicas de programación o análisis de datos. El curso incluye fundamentos de Python aplicados a Data Science, pero avanza hacia modelado, MLOps y despliegue.
Sí. El curso incluye pandas moderno, incluyendo buenas prácticas de asignación, Copy-on-Write, limpieza, joins, agrupaciones, fechas, optimización y pipelines de transformación.
Sí. Se incluyen Polars, PyArrow, Parquet y DuckDB para trabajar con datos grandes, análisis rápido, consultas SQL locales y flujos más eficientes que los basados exclusivamente en pandas.
Sí. Incluye machine learning supervisado, no supervisado, evaluación, selección de modelos, ajuste de hiperparámetros, métricas, explicabilidad, fairness y análisis de errores.
Sí. Incluye una introducción práctica a deep learning con PyTorch, TensorFlow o Keras, siempre explicando cuándo aporta valor frente a modelos clásicos.
Sí. Incluye uso de LLMs en Data Science, embeddings, RAG básico, análisis documental, evaluación de respuestas, seguridad de prompts y límites de la IA generativa.
Sí. Todo el temario está orientado a casos empresariales y termina con un proyecto final integrador que cubre datos, EDA, modelo, evaluación, despliegue, documentación y presentación.
Sí. Se trabaja despliegue con FastAPI, Streamlit o Gradio, empaquetado con Docker, tracking con MLflow y monitorización de rendimiento, errores y drift.
Sí, especialmente si trabajan con datos y decisiones. Los perfiles no técnicos podrán aprovechar mejor las partes de análisis, visualización, interpretación, métricas, storytelling y casos de uso.
Este curso no enseña Python de forma aislada. Python se usa como herramienta para resolver problemas de datos: limpieza, análisis, modelos, IA, automatización, despliegue y comunicación de resultados.
Sí. Al tratarse de una formación corporativa en Python, Data Science, IA, machine learning, analítica, automatización, productividad y competencias digitales, puede plantearse como formación bonificable hasta el 100% a través de FUNDAE, según el crédito disponible y cumpliendo los requisitos administrativos aplicables.
Es un curso corporativo avanzado, pero empieza ordenando conceptos fundamentales. Es adecuado para perfiles con base técnica o analítica que quieran trabajar Data Science con Python de forma profesional.
Conviene tener nociones básicas de programación o análisis de datos. El curso incluye fundamentos de Python aplicados a Data Science, pero avanza hacia modelado, MLOps y despliegue.
Sí. El curso incluye pandas moderno, incluyendo buenas prácticas de asignación, Copy-on-Write, limpieza, joins, agrupaciones, fechas, optimización y pipelines de transformación.
Sí. Se incluyen Polars, PyArrow, Parquet y DuckDB para trabajar con datos grandes, análisis rápido, consultas SQL locales y flujos más eficientes que los basados exclusivamente en pandas.
Sí. Incluye machine learning supervisado, no supervisado, evaluación, selección de modelos, ajuste de hiperparámetros, métricas, explicabilidad, fairness y análisis de errores.
Sí. Incluye una introducción práctica a deep learning con PyTorch, TensorFlow o Keras, siempre explicando cuándo aporta valor frente a modelos clásicos.
Sí. Incluye uso de LLMs en Data Science, embeddings, RAG básico, análisis documental, evaluación de respuestas, seguridad de prompts y límites de la IA generativa.
Sí. Todo el temario está orientado a casos empresariales y termina con un proyecto final integrador que cubre datos, EDA, modelo, evaluación, despliegue, documentación y presentación.
Sí. Se trabaja despliegue con FastAPI, Streamlit o Gradio, empaquetado con Docker, tracking con MLflow y monitorización de rendimiento, errores y drift.
Sí, especialmente si trabajan con datos y decisiones. Los perfiles no técnicos podrán aprovechar mejor las partes de análisis, visualización, interpretación, métricas, storytelling y casos de uso.
Este curso no enseña Python de forma aislada. Python se usa como herramienta para resolver problemas de datos: limpieza, análisis, modelos, IA, automatización, despliegue y comunicación de resultados.
Sí. Al tratarse de una formación corporativa en Python, Data Science, IA, machine learning, analítica, automatización, productividad y competencias digitales, puede plantearse como formación bonificable hasta el 100% a través de FUNDAE, según el crédito disponible y cumpliendo los requisitos administrativos aplicables.
Diseñemos hoy el curso que tu empresa necesita
Cuéntanos tus objetivos de negocio y prepararemos una propuesta formativa bonificable totalmente ad hoc
insiste en entornos aislados, Git, estructura de proyecto, validaciones, pipelines, documentación, versionado y control de datos para evitar análisis imposibles de repetir.
2
Prepara para datasets reales y no perfectos Se trabajan nulos, duplicados, outliers, datos grandes, fuentes heterogéneas, texto, fechas, SQL, APIs, Parquet y calidad del dato, porque los proyectos reales rara vez parten de datasets limpios.
3
Cubre modelos clásicos, avanzados y generativos El programa incluye regresión, clasificación, clustering, anomalías, series temporales, NLP, embeddings, deep learning y LLMs, explicando cuándo conviene cada enfoque.
4
Incorpora despliegue y operación El curso no termina en el notebook. Incluye MLflow, FastAPI, Streamlit, Docker, monitorización, drift, retraining, trazabilidad y soporte de modelos.
5
Refuerza ética, privacidad y gobernanza Se trabajan sesgos, explicabilidad, datos sensibles, revisión humana, uso responsable de IA generativa, documentación y límites de los modelos en decisiones empresariales.
Después de la formación en directo, los alumnos podrán acceder a ejercicios prácticos para aplicar lo trabajado en clase y consolidar el aprendizaje con actividades guiadas.
Acceso a las grabaciones
Los alumnos podrán revisar las sesiones grabadas para repasar conceptos clave, recuperar explicaciones concretas o reforzar aquellos contenidos que necesiten después de la clase en directo.
Recursos formativos
Materiales, sesiones grabadas y documentación de apoyo quedan centralizados en la plataforma para que el equipo pueda consultarlos durante y después de la formación.
Confirmación de asistencia
La plataforma permite registrar y confirmar la asistencia de los participantes, facilitando el seguimiento de la formación y la gestión documental necesaria para la bonificación FUNDAE.
Ejercicios prácticos
Después de la formación en directo, los alumnos podrán acceder a ejercicios prácticos para aplicar lo trabajado en clase y consolidar el aprendizaje con actividades guiadas.
Practica y mejora con nuestra plataforma
Una plataforma practica, con IA integrada y pensada para que mejores desarrollando. Se adapta a tu ritmo, te corrige al instante y te muestra tu progreso real.
Correccion magica
Feedback inteligente
Aprende de cada acierto y fallo con explicaciones claras
Equipos de datos y científicos de datos junior/intermedios
Los perfiles de datos podrán reforzar fundamentos, ordenar su forma de trabajar y cubrir todo el ciclo profesional: exploración, preparación, modelado, evaluación, interpretabilidad, versionado, experimentación, monitorización y comunicación de resultados. El objetivo es pasar de notebooks experimentales a soluciones más robustas y mantenibles.
Responsables de negocio, operaciones y transformación digital
Los responsables de área podrán entender cómo se construyen proyectos de Data Science, qué datos hacen falta, qué riesgos existen, qué métricas deben revisarse y cómo interpretar resultados sin caer en conclusiones simplistas. La formación les ayuda a plantear mejores casos de uso y a evaluar proyectos de IA con criterio.
Equipos de marketing, ventas, finanzas, RRHH y atención al cliente
Los perfiles de negocio podrán aplicar Python a segmentación, predicción de demanda, churn, scoring, análisis de campañas, forecast financiero, clasificación de tickets, análisis de satisfacción, planificación de recursos y detección de anomalías. El curso se adapta a casos prácticos de distintos departamentos.
IT, arquitectura, gobierno del dato y seguridad
Los equipos responsables de plataformas, datos y cumplimiento podrán entender cómo se gestionan entornos Python, dependencias, datos sensibles, permisos, trazabilidad, despliegues, APIs, logs, monitorización y gobernanza de modelos. Esto facilita integrar Data Science en la organización de forma segura.