Despliega Databricks: Gestión y Análisis de Grandes Volúmenes de Datos A Medida para tu equipo tutorizado y bonificable por FUNDAE. Diseñamos el plan formativo.
Aprovecha el Lakehouse como ventaja competitiva Databricks permite construir agentes sobre datos gobernados, Delta, Unity Catalog, Vector Search, modelos, funciones y workflows. La formación muestra cómo usar esa base para responder con información fiable y auditable.
1
Personaliza el temario al 100% para tu equipo
Diseñamos una formación a medida utilizando los documentos y flujos de trabajo reales de tu empresa.
Nueva Plataforma de E-learningFormación en directo con plataforma de apoyo para reforzar el aprendizaje
Acceso a las grabaciones
Los alumnos podrán revisar las sesiones grabadas para repasar conceptos clave, recuperar explicaciones concretas o reforzar aquellos contenidos que necesiten después de la clase en directo.
Recursos formativos
Materiales, sesiones grabadas y documentación de apoyo quedan centralizados en la plataforma para que el equipo pueda consultarlos durante y después de la formación.
Confirmación de asistencia
La plataforma permite registrar y confirmar la asistencia de los participantes, facilitando el seguimiento de la formación y la gestión documental necesaria para la bonificación FUNDAE.
Programa formativo
Temario del curso
Encuentra todo el temario del curso aquí.
Temario
Situar Databricks Agents dentro de la Data Intelligence Platform y diferenciar agentes, apps GenAI, RAG, chatbots, copilotos y workflows tradicionales.
Comprender qué aporta construir agentes sobre Lakehouse: datos gobernados, trazabilidad, catálogos, calidad, lineage, evaluaciones y operación unificada.
Identificar escenarios donde un agente aporta valor real: consulta de conocimiento, análisis de datos, automatización, asistencia interna y soporte experto.
Reconocer cuándo no conviene crear un agente: datos sin calidad, procesos no definidos, permisos ambiguos o decisiones de alto riesgo sin revisión humana.
Diferenciar una prueba de concepto, un prototipo validado, una app interna y un agente productivo con SLA, seguridad y ownership.
Relacionar agentes Databricks con Unity Catalog, Vector Search, MLflow, Model Serving, Databricks Apps, AI Gateway y Lakehouse Monitoring.
Analizar el papel del agente como aplicación compuesta por modelos, herramientas, instrucciones, memoria, trazas y datos de evaluación.
Definir indicadores de éxito: precisión, groundedness, seguridad, coste, latencia, resolución, adopción y reducción de trabajo manual.
Preparar una matriz inicial de casos de uso según valor, riesgo, datos disponibles, herramientas necesarias y audiencia.
Establecer el recorrido del curso desde fundamentos y arquitectura hasta desarrollo, evaluación, despliegue, monitorización y gobierno.
Situar Databricks Agents dentro de la Data Intelligence Platform y diferenciar agentes, apps GenAI, RAG, chatbots, copilotos y workflows tradicionales.
Comprender qué aporta construir agentes sobre Lakehouse: datos gobernados, trazabilidad, catálogos, calidad, lineage, evaluaciones y operación unificada.
Identificar escenarios donde un agente aporta valor real: consulta de conocimiento, análisis de datos, automatización, asistencia interna y soporte experto.
Reconocer cuándo no conviene crear un agente: datos sin calidad, procesos no definidos, permisos ambiguos o decisiones de alto riesgo sin revisión humana.
Diferenciar una prueba de concepto, un prototipo validado, una app interna y un agente productivo con SLA, seguridad y ownership.
Relacionar agentes Databricks con Unity Catalog, Vector Search, MLflow, Model Serving, Databricks Apps, AI Gateway y Lakehouse Monitoring.
Analizar el papel del agente como aplicación compuesta por modelos, herramientas, instrucciones, memoria, trazas y datos de evaluación.
Definir indicadores de éxito: precisión, groundedness, seguridad, coste, latencia, resolución, adopción y reducción de trabajo manual.
Preparar una matriz inicial de casos de uso según valor, riesgo, datos disponibles, herramientas necesarias y audiencia.
Establecer el recorrido del curso desde fundamentos y arquitectura hasta desarrollo, evaluación, despliegue, monitorización y gobierno.
Tema 1: Databricks Agents en la plataforma de datos e IA: alcance, límites y primeros criterios
Situar Databricks Agents dentro de la Data Intelligence Platform y diferenciar agentes, apps GenAI, RAG, chatbots, copilotos y workflows tradicionales.
Comprender qué aporta construir agentes sobre Lakehouse: datos gobernados, trazabilidad, catálogos, calidad, lineage, evaluaciones y operación unificada.
Identificar escenarios donde un agente aporta valor real: consulta de conocimiento, análisis de datos, automatización, asistencia interna y soporte experto.
Reconocer cuándo no conviene crear un agente: datos sin calidad, procesos no definidos, permisos ambiguos o decisiones de alto riesgo sin revisión humana.
Diferenciar una prueba de concepto, un prototipo validado, una app interna y un agente productivo con SLA, seguridad y ownership.
Relacionar agentes Databricks con Unity Catalog, Vector Search, MLflow, Model Serving, Databricks Apps, AI Gateway y Lakehouse Monitoring.
Analizar el papel del agente como aplicación compuesta por modelos, herramientas, instrucciones, memoria, trazas y datos de evaluación.
Definir indicadores de éxito: precisión, groundedness, seguridad, coste, latencia, resolución, adopción y reducción de trabajo manual.
Preparar una matriz inicial de casos de uso según valor, riesgo, datos disponibles, herramientas necesarias y audiencia.
Establecer el recorrido del curso desde fundamentos y arquitectura hasta desarrollo, evaluación, despliegue, monitorización y gobierno.
Tema 2: Arquitectura de un agente en Databricks: componentes, patrones y decisiones iniciales
Diseñar la arquitectura lógica de un agente con entrada de usuario, orquestador, modelo, herramientas, recuperación, evaluación y respuesta final.
Diferenciar agentes basados en RAG, agentes tool-calling, agentes analíticos, agentes de automatización y sistemas multiagente.
Evaluar cuándo usar Databricks Apps, cuándo usar Model Serving y cuándo separar frontend, backend, endpoint y lógica de agente.
Comprender el papel de ResponsesAgent como interfaz recomendada para empaquetar aplicaciones GenAI orientadas a serving.
Definir qué datos necesita el agente y qué parte debe venir de tablas Delta, documentos, APIs, funciones, búsquedas vectoriales o herramientas externas.
Diseñar límites de autonomía: qué puede consultar, qué puede ejecutar, qué debe pedir, qué debe rechazar y cuándo debe escalar a humano.
Separar instrucciones del sistema, herramientas disponibles, contexto recuperado, estado de sesión y salida generada.
Preparar una arquitectura que permita observabilidad desde el primer día mediante trazas, request IDs, datasets, evaluaciones y feedback.
Evitar diseños monolíticos donde prompt, retrieval, tools, logging y UI quedan mezclados en un único notebook difícil de desplegar.
Documentar decisiones de arquitectura para que el agente pueda mantenerse por equipos distintos a quienes hicieron la demo inicial.
Tema 3: Preparación del workspace, permisos y entorno de desarrollo
Configurar un workspace Databricks con Unity Catalog, SQL Warehouse, clusters, notebooks, repositorios, secrets y permisos adecuados al laboratorio.
Crear catálogos, esquemas, volúmenes, tablas y funciones de prueba siguiendo una nomenclatura clara por entorno y equipo.
Configurar Databricks CLI, perfiles, tokens, autenticación, repositorios y conexión desde entorno local.
Preparar un proyecto Python con estructura de app, agente, herramientas, evaluaciones, configuración, tests y despliegue.
Instalar librerías necesarias para MLflow 3, Databricks SDK, clientes de modelos, frameworks de agente y utilidades de evaluación.
Separar configuración local, staging y producción mediante variables, secretos, archivos YAML y parámetros de despliegue.
Crear datos de laboratorio con documentos, tablas, preguntas esperadas, respuestas de referencia y casos negativos.
Configurar permisos de usuario, service principals y grupos para evitar trabajar siempre con credenciales personales de administrador.
Validar conectividad con modelos, tablas, Vector Search, endpoints y recursos antes de escribir lógica del agente.
Documentar el entorno para que el laboratorio sea reproducible por otros equipos o futuras convocatorias.
Tema 4: Unity Catalog como base de gobierno para agentes
Comprender Unity Catalog como capa de gobierno para datos, modelos, funciones, volúmenes, permisos y activos de IA usados por agentes.
Diseñar catálogos y esquemas específicos para agentes, separando datos fuente, embeddings, evaluaciones, logs, herramientas y resultados.
Configurar permisos mínimos sobre tablas, vistas, funciones y modelos para que el agente solo acceda a lo necesario.
Utilizar views o funciones controladas para exponer datos al agente sin abrir tablas sensibles completas.
Revisar lineage y ownership de datos usados por el agente para saber quién responde por calidad, actualización y significado.
Gestionar datos personales, información sensible y columnas restringidas antes de permitir uso en prompts o herramientas.
Controlar funciones de Unity Catalog como herramientas legacy, entendiendo cuándo son adecuadas y cuándo conviene usar MCP tools.
Documentar políticas de acceso por tipo de agente, entorno, usuario, dominio de negocio y criticidad.
Preparar una checklist de seguridad de Unity Catalog antes de desplegar agentes que consultan datos reales.
Convertir Unity Catalog en pieza central del gobierno de agentes, no solo en catálogo pasivo de tablas.
Tema 5: Diseño de datos para agentes: Delta, documentos, tablas y señales de negocio
Identificar qué datos estructurados, semiestructurados y no estructurados necesita el agente para responder con utilidad.
Preparar tablas Delta con datos limpios, actualizados y documentados para alimentar herramientas analíticas o recuperación contextual.
Diseñar vistas semánticas que traduzcan tablas técnicas en conceptos comprensibles para el agente y sus usuarios.
Preparar documentos corporativos con estructura, metadatos, fechas, propietarios y clasificación de sensibilidad.
Gestionar versiones de documentos y datasets para saber qué información alimentó cada respuesta en cada momento.
Separar datos de entrenamiento, evaluación, grounding, feedback y monitorización para evitar mezclas poco auditables.
Crear datasets de preguntas frecuentes, casos límite, consultas de negocio y respuestas esperadas para desarrollo.
Evitar que el agente use tablas experimentales, columnas sin definición o documentos obsoletos como fuente de verdad.
Incorporar señales de negocio como cliente, canal, producto, región, periodo o criticidad para respuestas más útiles.
Documentar calidad, actualización, limitaciones y propietario de cada fuente conectada al agente.
Tema 6: RAG en Databricks: recuperación, embeddings y Vector Search
Diseñar una arquitectura RAG sobre Databricks combinando documentos, chunking, embeddings, Vector Search, filtros y generación final.
Crear estrategias de partición de documentos que respeten secciones, contexto, tablas, FAQs y fragmentos con significado propio.
Generar embeddings con modelos aprobados y almacenar metadatos que permitan filtros por fuente, versión, idioma, fecha o permisos.
Crear índices de Vector Search y validar recuperación con consultas representativas antes de conectar el flujo al agente.
Diseñar filtros de seguridad y metadata para impedir que un usuario reciba contexto de documentos no autorizados.
Comparar retrieval por similitud, filtros, reranking y estrategias híbridas cuando el dominio lo requiere.
Medir calidad de recuperación usando ejemplos reales y evaluaciones de relevancia, cobertura y groundedness.
Detectar problemas habituales: chunks demasiado grandes, documentos duplicados, embeddings pobres, metadatos ausentes o recuperación fuera de contexto.
Preparar un flujo de actualización de índices cuando cambian documentos, políticas, contratos o fuentes internas.
Documentar el pipeline RAG para que sea mantenible por data engineering, no solo por el equipo IA.
Tema 7: Modelos foundation, endpoints y selección de modelo
Evaluar modelos disponibles en Databricks o proveedores conectados según calidad, coste, latencia, seguridad y soporte de tool calling.
Diferenciar modelos para razonamiento, generación, clasificación, resumen, extracción, embeddings y evaluación.
Configurar endpoints de Foundation Model APIs o Model Serving según necesidades del agente.
Diseñar una política de selección de modelo por tarea en lugar de utilizar siempre el modelo más potente.
Medir impacto de temperatura, max tokens, contexto, streaming, herramientas y prompts sobre coste y latencia.
Preparar fallback entre modelos cuando el proveedor falla o cuando una tarea puede degradarse de forma aceptable.
Documentar modelos permitidos por entorno, tipo de dato, criticidad y caso de uso.
Evitar mezclar modelos en producción sin evaluación comparativa, trazabilidad y revisión de seguridad.
Configurar secrets y credenciales para proveedores externos sin exponer claves en notebooks o repositorios.
Crear una matriz de decisión para escoger modelo durante diseño, evaluación y operación.
Tema 8: Authoring de agentes con código: estructura, interfaces y buenas prácticas
Crear un agente en Python con estructura modular separando entrada, orquestación, herramientas, recuperación, evaluación y respuesta.
Implementar la interfaz ResponsesAgent o patrón equivalente recomendado para empaquetar la app de agente.
Diseñar funciones pequeñas y testeables para retrieval, tool selection, validación, formateo de respuesta y manejo de errores.
Gestionar estado de conversación sin mezclar datos sensibles, memoria no gobernada o contexto innecesario.
Preparar configuración externa para modelos, endpoints, índices, prompts, límites, herramientas y entornos.
Incorporar logs estructurados, trace IDs y metadata desde la primera versión del agente.
Evitar notebooks monolíticos como artefacto final cuando el agente debe desplegarse, versionarse y operar.
Crear tests unitarios para herramientas, prompts críticos, filtros, parsing, validaciones y tratamiento de errores.
Documentar contratos de entrada y salida para que frontend, evaluadores y herramientas externas puedan integrarse.
Diseñar el código pensando en CI/CD, rollback, monitorización y mantenimiento por un equipo.
Tema 9: Herramientas del agente: MCP, APIs externas, Python y funciones gobernadas
Diseñar herramientas que permitan al agente consultar información, ejecutar lógica, llamar APIs o realizar cálculos bajo control.
Incorporar MCP servers cuando se necesita conectar el agente con sistemas externos de forma estándar y mantenible.
Usar el code interpreter `system.ai.python_exec` para permitir ejecución Python dinámica en escenarios controlados.
Evaluar Unity Catalog functions como herramientas legacy cuando ya existen funciones gobernadas o lógica interna reutilizable.
Crear tools con contratos claros: descripción, entradas, salidas, errores, límites, permisos y ejemplos.
Evitar herramientas demasiado amplias que permiten al agente ejecutar acciones sin suficiente contexto o validación.
Gestionar credenciales de APIs externas mediante secrets, managed OAuth o patrones autorizados por seguridad.
Diseñar herramientas read-only para exploración y herramientas de escritura con confirmación, auditoría y permisos reforzados.
Probar herramientas de forma aislada antes de incorporarlas al flujo conversacional del agente.
Documentar cada tool con owner, finalidad, sistemas afectados, riesgo y criterios de desactivación.
Tema 10: Tool calling y control de acciones en agentes empresariales
Configurar el agente para elegir herramientas según intención, contexto, restricciones y disponibilidad de datos.
Diseñar descripciones de herramientas suficientemente precisas para reducir llamadas incorrectas o innecesarias.
Validar argumentos generados por el modelo antes de ejecutar acciones que consultan datos o sistemas externos.
Implementar confirmaciones humanas cuando una acción modifica información, crea recursos o envía comunicaciones.
Controlar errores de herramienta diferenciando fallo técnico, dato no encontrado, permiso insuficiente y acción fuera de alcance.
Evitar bucles de tool calling cuando el agente insiste en una acción que falla o no devuelve información útil.
Registrar cada invocación con inputs, outputs, usuario, sesión, duración, coste y resultado.
Crear políticas de herramienta por entorno: desarrollo, pruebas, staging, producción y datos sensibles.
Evaluar la calidad del tool calling con datasets de conversación y casos adversariales.
Construir una capa de seguridad que limite lo que el modelo puede ejecutar aunque intente invocar una herramienta válida.
Tema 11: Construcción de agentes RAG empresariales de extremo a extremo
Crear un agente RAG que reciba una pregunta, recupere documentos, cite fuentes internas y responda de forma limitada al contexto disponible.
Diseñar prompts que obliguen al agente a reconocer falta de evidencia, pedir aclaraciones o escalar cuando no hay base suficiente.
Incorporar filtros por usuario, departamento, idioma, fecha, producto o permiso antes de recuperar contexto.
Añadir trazabilidad de fuentes para que el usuario pueda revisar documentos, fragmentos o tablas usados en la respuesta.
Evaluar si el agente responde con información recuperada o si introduce conocimiento externo no autorizado.
Medir latencia total separando retrieval, generación, reranking, herramientas y respuesta final.
Crear pruebas de preguntas con respuesta conocida, preguntas ambiguas, preguntas sin respuesta y preguntas con información contradictoria.
Ajustar chunking, embeddings, filtros, prompt y modelo según resultados de evaluación.
Preparar actualización incremental de documentos y reindexación controlada.
Documentar arquitectura RAG, fuentes conectadas, riesgos, métricas y plan de mantenimiento.
Tema 12: Agentes analíticos sobre Lakehouse y SQL empresarial
Diseñar agentes capaces de responder preguntas de negocio consultando tablas gobernadas, vistas semánticas o SQL controlado.
Crear herramientas SQL seguras que eviten consultas arbitrarias sobre todo el Lakehouse sin permisos ni límites.
Exponer vistas certificadas en lugar de tablas crudas cuando el agente responde a usuarios de negocio.
Validar consultas generadas antes de ejecutarlas, aplicando límites, filtros, timeouts y control de coste.
Diseñar respuestas que incluyan explicación, resultado, periodo, filtros, limitaciones y enlace a datos cuando corresponda.
Evitar que el agente invente métricas si no existe definición certificada en el Lakehouse.
Incorporar control de acceso mediante Unity Catalog para que cada usuario consulte solo datos permitidos.
Registrar SQL ejecutado, duración, volumen procesado, usuario y resultado para auditoría y mejora.
Evaluar respuestas analíticas con preguntas de referencia, SQL esperado y resultados validados.
Construir un agente de datos que complemente BI y SQL, sin reemplazar gobierno de métricas ni reporting oficial.
Tema 13: Multi-agent systems y Supervisor Agent
Comprender cuándo un sistema multiagente aporta valor frente a un agente único con varias herramientas.
Diseñar un Supervisor Agent que coordine agentes especializados por dominio, herramienta, etapa o tipo de razonamiento.
Separar responsabilidades entre agente de planificación, agente RAG, agente analítico, agente de código, agente de revisión y agente de respuesta.
Definir protocolos de comunicación entre agentes para evitar contradicciones, duplicidad de trabajo o pérdida de contexto.
Controlar permisos diferenciados por agente para que un subagente no pueda acceder a herramientas que no necesita.
Medir coste y latencia adicional de sistemas multiagente antes de llevarlos a producción.
Evaluar calidad de coordinación, selección de agente y consolidación de respuesta final.
Evitar arquitecturas multiagente por moda cuando el caso se resuelve con un flujo más simple.
Documentar el rol, herramientas, límites y owner de cada agente especializado.
Diseñar pruebas end-to-end que cubran colaboración, fallos parciales y escalado humano.
Tema 14: Agent Bricks y aceleración de agentes especializados
Situar Agent Bricks como enfoque para acelerar la construcción de agentes especializados optimizados sobre datos empresariales.
Evaluar cuándo Agent Bricks aporta rapidez frente a un desarrollo de agente custom desde cero.
Identificar casos de uso candidatos: agentes de conocimiento, analítica, extracción, clasificación, soporte o automatización.
Revisar cómo conectar datos, permisos, modelos y herramientas dentro del patrón de Agent Bricks disponible en la plataforma.
Comparar calidad, control, tiempo de desarrollo y capacidad de personalización frente a agentes escritos manualmente.
Diseñar pruebas para validar que el agente generado cumple requisitos funcionales, seguridad y groundedness.
Preparar criterios de salida cuando un prototipo creado con Agent Bricks debe evolucionar hacia una app mantenida por ingeniería.
Documentar configuración, fuentes, versiones, métricas y límites del agente acelerado.
Evaluar coste y rendimiento antes de escalar uso a muchos equipos o casos de negocio.
Incorporar Agent Bricks dentro de una estrategia de adopción gradual, no como sustituto del gobierno técnico.
Tema 15: Databricks Apps para agentes: frontend, backend y experiencia de usuario
Crear una Databricks App que exponga el agente mediante una interfaz controlada, segura y alineada con usuarios internos.
Separar lógica de agente, capa de API, interfaz, configuración y observabilidad para facilitar mantenimiento.
Diseñar una experiencia conversacional con historial, feedback, fuentes, disclaimers y mensajes de error comprensibles.
Gestionar autenticación, permisos de usuario y acceso a datos desde la app sin exponer credenciales de servicio innecesarias.
Incorporar streaming de respuestas cuando mejora experiencia sin complicar trazabilidad o evaluación.
Preparar variables de entorno, dependencias, configuración de despliegue y runtime de la app.
Validar que la app funciona con distintos perfiles de usuario y límites de acceso definidos por Unity Catalog.
Añadir controles de feedback humano para capturar utilidad, errores, comentarios y casos de mejora.
Diseñar logs de aplicación que puedan correlacionarse con MLflow traces e inference tables.
Documentar la app como producto interno con owner, soporte, versiones, changelog y procedimiento de rollback.
Tema 16: Model Serving para agentes, endpoints y patrones de despliegue
Desplegar agentes o aplicaciones GenAI en Model Serving cuando el caso requiere endpoint gestionado, escalado y consumo vía API.
Empaquetar código, dependencias, archivos y configuración siguiendo patrones compatibles con MLflow y Databricks serving.
Configurar endpoints, permisos, service principals, secrets, escalado, límites y acceso de clientes.
Comparar Model Serving con Databricks Apps según control de UI, configuración, experiencia, despliegue y operación.
Preparar payloads de entrada y salida para clientes internos, aplicaciones web, integraciones o pipelines.
Validar endpoints con pruebas funcionales, carga básica, errores y comportamiento ante timeouts.
Controlar versiones de modelo o agente para poder actualizar sin romper consumidores.
Medir latencia, coste, errores, cold starts, saturación y comportamiento bajo concurrencia.
Configurar inference tables o mecanismos equivalentes para capturar requests y responses del endpoint.
Documentar contrato de API, autenticación, límites, errores, SLA y procedimiento de soporte.
Tema 17: Querying de agentes desplegados y consumo desde aplicaciones
Enviar requests a agentes desplegados mediante SDK, API, notebooks, apps internas o clientes externos autorizados.
Diseñar payloads con mensaje, historial, contexto, usuario, metadata y parámetros necesarios para reproducibilidad.
Gestionar sesiones conversacionales sin exponer datos sensibles ni depender de memoria no gobernada.
Incorporar retries, timeouts, backoff y manejo de errores en clientes que consumen endpoints de agente.
Validar streaming, respuesta final, tool calls, citas, trazas y metadatos devueltos por el agente.
Separar llamadas de desarrollo, pruebas y producción mediante endpoints, tokens, usuarios o entornos diferenciados.
Diseñar clientes internos que muestren fuentes, confianza, limitaciones y feedback de usuario.
Evitar que aplicaciones externas puedan enviar instrucciones que fuerzan acceso indebido a herramientas o datos.
Registrar consumo por aplicación, usuario, cliente, caso de uso y feature para análisis de coste y adopción.
Documentar patrones de integración para que otros equipos consuman agentes Databricks de forma segura.
Tema 18: MLflow 3 for GenAI: tracing, versionado y observabilidad de desarrollo
Utilizar MLflow Tracing para registrar pasos del agente, llamadas a modelos, retrieval, herramientas, errores y tiempos.
Diferenciar trazas de desarrollo, trazas de evaluación y trazas de producción para analizarlas con contexto correcto.
Registrar metadata como usuario, sesión, versión, modelo, prompt, dataset, herramienta y fuente de datos.
Revisar trazas para detectar razonamientos fallidos, tool calls innecesarias, retrieval pobre o respuestas sin grounding.
Versionar agentes, prompts, configuraciones, datasets y evaluaciones para comparar cambios con evidencia.
Incorporar feedback humano en el ciclo de mejora del agente.
Evitar que trazas almacenen información sensible sin redacción, minimización o permisos adecuados.
Crear experimentos MLflow que agrupen variantes de agente, modelo, prompt, retrieval y herramientas.
Analizar latencia y coste por componente del agente para optimizar donde realmente importa.
Convertir tracing en práctica obligatoria antes de desplegar agentes empresariales.
Tema 19: Evaluación de agentes con MLflow GenAI y Agent Evaluation
Crear datasets de evaluación con preguntas, contexto esperado, respuestas de referencia y criterios de calidad.
Utilizar `mlflow.genai.evaluate()` para probar sistemáticamente la calidad del agente durante desarrollo.
Aplicar scorers para relevancia, groundedness, seguridad, corrección, formato, retrieval y utilidad de respuesta.
Incorporar built-in LLM judges cuando se necesita empezar rápido con evaluación de calidad.
Crear scorers personalizados para métricas específicas del negocio, compliance, tono, formato o reglas internas.
Comparar versiones del agente antes de aprobar cambios de prompt, modelo, retrieval o tools.
Diseñar evaluaciones offline con casos positivos, negativos, adversariales y sin respuesta esperada.
Evitar datasets de evaluación demasiado pequeños o preparados solo para que el agente “apruebe” la demo.
Documentar resultados de evaluación, umbrales mínimos, fallos aceptados y decisiones de release.
Integrar evaluación en CI/CD para bloquear cambios que degradan calidad, seguridad o coste.
Tema 20: Groundedness, seguridad, correctness y evaluación con judges
Medir groundedness verificando que la respuesta se apoya en documentos, tablas o herramientas realmente utilizadas.
Evaluar correctness cuando existe una respuesta esperada o una regla de negocio verificable.
Revisar relevancia para comprobar si la respuesta atiende la pregunta del usuario sin desviarse ni añadir ruido.
Evaluar seguridad para detectar respuestas peligrosas, datos no autorizados, instrucciones indebidas o contenido fuera de política.
Crear pruebas de prompt injection, datos contradictorios, preguntas ambiguas y solicitudes de extracción de información sensible.
Diseñar criterios de evaluación por dominio, evitando utilizar una única métrica genérica para todos los agentes.
Analizar falsos positivos y falsos negativos de judges para no aceptar evaluaciones automáticas sin revisión humana.
Combinar evaluación automática con revisión experta en casos críticos o regulados.
Registrar fallos recurrentes para mejorar retrieval, prompt, herramientas, datos o permisos.
Crear un informe de calidad de agente que pueda revisarse por negocio, seguridad e ingeniería.
Tema 21: Human feedback, Review App y mejora con usuarios expertos
Capturar feedback humano sobre respuestas del agente, fuentes utilizadas, precisión, utilidad y calidad conversacional.
Utilizar review workflows para que expertos de negocio evalúen respuestas sin necesidad de revisar código.
Diseñar escalas de feedback simples pero útiles: correcto, incorrecto, incompleto, inseguro, sin evidencia o no útil.
Asociar feedback a trace, usuario, pregunta, versión de agente, modelo, prompt, retrieval y herramienta usada.
Convertir feedback en datasets de evaluación, casos de regresión, mejoras de prompt o cambios de fuente documental.
Evitar feedback informal en chats o documentos sueltos que no se puede conectar con la versión exacta del agente.
Priorizar mejoras por impacto, frecuencia, riesgo y coste de corrección.
Crear procesos de revisión con expertos legales, soporte, ventas, datos o seguridad según el dominio del agente.
Medir si la calidad mejora con cada iteración comparando evaluaciones y feedback histórico.
Incorporar revisión humana como parte del ciclo de vida, no como actividad puntual de validación inicial.
Tema 22: Inference tables, AI Gateway y monitorización en producción
Activar inference tables habilitadas por AI Gateway para capturar requests, responses y trazas de agentes desplegados.
Analizar tablas Delta generadas con datos de inferencia para revisar coste, latencia, errores, usuarios, prompts y outputs.
Conectar inference tables con dashboards, evaluaciones, Lakehouse Monitoring y procesos de auditoría.
Separar datos de monitorización por endpoint, agente, versión, entorno, cliente o aplicación consumidora.
Diseñar retención, acceso y redacción de logs de inferencia según sensibilidad de prompts y respuestas.
Detectar anomalías de producción: aumento de errores, latencia, coste, respuestas vacías, tool failures o caída de groundedness.
Crear queries SQL sobre inference tables para investigar incidentes, comparar versiones y revisar adopción.
Integrar monitorización de agentes con alertas operativas y runbooks de soporte.
Evitar monitorización que captura todo sin gobierno ni revisión de privacidad.
Convertir inference tables en base objetiva para mejorar calidad, coste y seguridad del agente.
Tema 23: Lakehouse Monitoring para GenAI y seguimiento continuo de calidad
Configurar monitorización sobre agentes y aplicaciones GenAI para seguir calidad, latencia, coste y comportamiento en producción.
Definir métricas de producción alineadas con evaluaciones de desarrollo para no medir cosas distintas antes y después del despliegue.
Crear dashboards de salud del agente con volumen, errores, latencia, coste, feedback, groundedness y uso de herramientas.
Detectar drift funcional cuando cambian datos, documentos, usuarios, preguntas o modelos.
Programar evaluaciones periódicas sobre muestras de producción para revisar calidad real.
Configurar alertas ante degradaciones de seguridad, groundedness, latencia o coste.
Revisar diferencias entre agentes internos, customer-facing, analíticos y RAG en métricas de seguimiento.
Documentar owners de monitorización, umbrales, procedimientos de respuesta y frecuencia de revisión.
Evitar que monitorización sea responsabilidad exclusiva del equipo IA sin participación de negocio y operación.
Crear un ciclo de mejora continua basado en evidencias de producción.
Tema 24: Seguridad de agentes: permisos, datos sensibles y prompt injection
Identificar riesgos de seguridad propios de agentes: acceso indebido a datos, tool misuse, prompt injection, data leakage y respuestas no autorizadas.
Aplicar permisos Unity Catalog para limitar datos, funciones, modelos, volúmenes y herramientas disponibles.
Diseñar filtros por usuario, grupo, departamento o tenant antes de recuperar documentos o ejecutar consultas.
Proteger secrets, tokens y credenciales de herramientas externas mediante mecanismos seguros del workspace.
Crear pruebas adversariales con instrucciones maliciosas, documentos contaminados y preguntas diseñadas para extraer información sensible.
Validar que el agente no revela fuentes, prompts internos, credenciales, tablas restringidas o datos fuera de permisos.
Limitar herramientas de escritura, código dinámico y APIs externas con confirmaciones, allowlists y controles de entrada.
Definir políticas para datos personales, propiedad intelectual, información financiera y documentos regulados.
Registrar incidentes de seguridad del agente y convertirlos en mejoras de prompt, herramienta, permisos o datos.
Documentar una matriz de riesgos antes de publicar agentes con usuarios reales.
Tema 25: Coste, latencia y optimización de agentes en Databricks
Medir coste por conversación, request, modelo, herramienta, retrieval, endpoint, usuario y caso de uso.
Separar latencia de retrieval, generación, tool calling, ejecución Python, consultas SQL y respuesta de frontend.
Crear documentación de usuario, runbooks de soporte y procedimientos de retirada de agentes obsoletos.
Definir políticas de retención de trazas, requests, respuestas, feedback y datasets de evaluación.
Medir madurez de agentes con indicadores de cobertura, calidad, seguridad, adopción, coste y mantenimiento.
Convertir Databricks Agents en una capacidad corporativa repetible y no en iniciativas aisladas de cada equipo.
Tema 30: Proyecto Final
Diseñar un agente Databricks empresarial para responder preguntas sobre documentación, datos gobernados y procesos internos.
Preparar workspace, Unity Catalog, catálogos, esquemas, tablas, volúmenes, permisos, secrets y estructura de proyecto.
Crear un pipeline RAG con documentos, chunking, embeddings, Vector Search, metadata, filtros y pruebas de recuperación.
Implementar el agente en Python usando estructura modular, configuración por entorno y patrón compatible con despliegue.
Incorporar herramientas MCP, Python o funciones gobernadas para consultar datos, ejecutar lógica o llamar APIs de laboratorio.
Registrar trazas con MLflow 3 incluyendo retrieval, modelo, herramientas, errores, latencia, metadata y versión.
Crear datasets de evaluación con preguntas, respuestas esperadas, casos negativos, prompt injection y escenarios sin respuesta.
Ejecutar evaluaciones con scorers de groundedness, relevancia, seguridad, correctness, coste y latencia.
Desplegar el agente en Databricks Apps o Model Serving justificando la elección arquitectónica.
Activar monitorización mediante inference tables, dashboards, feedback humano y queries de análisis operativo.
Configurar permisos de acceso, service principal, secretos, límites de herramientas y política de datos sensibles.
Crear un pipeline CI/CD básico con tests, evaluación, validación de configuración y despliegue controlado.
Preparar runbook de operación con errores frecuentes, rollback, actualización de índices, revisión de trazas y escalado.
Presentar la solución final defendiendo arquitectura, datos, seguridad, evaluación, despliegue, coste, monitorización y gobierno.
Perfiles profesionales
Pensado para quienes deben dominar Databricks Agents en su día a día
Data Engineers y Analytics Engineers
Este curso encaja con perfiles que ya trabajan con Lakehouse, Delta, SQL, pipelines y datasets gobernados. La formación les permite preparar datos, embeddings, tablas, funciones, catálogos y fuentes de conocimiento para que los agentes respondan con información fiable y trazable.
Machine Learning Engineers y AI Engineers
Los perfiles de IA aprenderán a construir agentes con MLflow 3, ResponsesAgent, tracing, evaluaciones, scorers, datasets, feedback humano y monitorización. El curso les ayuda a pasar de prototipos GenAI a aplicaciones robustas, versionadas y comparables.
Preguntas frecuentes
Resolvemos todas tus dudas sobre nuestra formación en Databricks Agents
Explora las respuestas a las preguntas que guian a nuestra comunidad. Aqui encontraras claridad sobre como funciona todo, desde el acceso hasta los detalles de los cursos. Si buscas respuestas, este es el lugar para comenzar.
Son aplicaciones de IA generativa construidas sobre Databricks que pueden usar modelos, datos, herramientas, recuperación, evaluación y despliegue para responder preguntas o ejecutar tareas en escenarios empresariales.
Cubre ambos. Se trabaja RAG con Vector Search y documentos, pero también tool calling, MCP, Python execution, funciones gobernadas, APIs externas, agentes analíticos y sistemas multiagente.
Sí, es recomendable conocer notebooks, clusters o serverless, SQL, Delta, Unity Catalog y fundamentos de Lakehouse. El curso es avanzado y está orientado a equipos que ya trabajan o van a trabajar en Databricks.
Sí. MLflow 3 es una parte central del curso: tracing, evaluación, feedback humano, versionado, scorers, datasets, monitorización y seguimiento de calidad durante desarrollo y producción.
Sí. El curso cubre Databricks Apps como opción recomendada para agentes con mayor control sobre código, configuración y experiencia. También se compara con Model Serving cuando el caso requiere endpoint API.
Sí. Se trabaja despliegue de agentes en endpoints, empaquetado de código, permisos, inference tables, consumo vía API, escalado, errores, latencia y contrato de integración.
Sí. Unity Catalog se trata como base de gobierno y Vector Search como pieza clave para agentes RAG. Se trabajan catálogos, permisos, volúmenes, tablas, documentos, embeddings, índices y metadata.
Sí. El curso incluye MCP tools, herramientas externas, code interpreter con Python, funciones de Unity Catalog como soporte legacy y criterios de seguridad para cada herramienta.
Sí. Agent Bricks aparece como bloque avanzado para acelerar agentes especializados, comparando cuándo conviene usarlo frente a desarrollo custom y cómo incorporarlo al gobierno corporativo.
Sí. El enfoque principal son agentes internos y empresariales: soporte, datos, finanzas, operaciones, compliance, desarrollo, documentación y asistentes sobre conocimiento corporativo.
Sí. Hay bloques específicos sobre permisos, Unity Catalog, datos sensibles, secrets, tool misuse, prompt injection, filtros de recuperación, respuestas no autorizadas y evaluación adversarial.
Sí. El Proyecto Final puede orientarse a documentación interna, datos corporativos, BI, soporte, operaciones, finanzas, legal, producto o cualquier caso GenAI de la empresa con datos anonimizados.
Sí, esta formación puede ser bonificable hasta el 100% a través de FUNDAE, siempre que la empresa disponga de crédito formativo suficiente y se cumplan los requisitos de comunicación, asistencia y documentación exigidos.
Son aplicaciones de IA generativa construidas sobre Databricks que pueden usar modelos, datos, herramientas, recuperación, evaluación y despliegue para responder preguntas o ejecutar tareas en escenarios empresariales.
Cubre ambos. Se trabaja RAG con Vector Search y documentos, pero también tool calling, MCP, Python execution, funciones gobernadas, APIs externas, agentes analíticos y sistemas multiagente.
Sí, es recomendable conocer notebooks, clusters o serverless, SQL, Delta, Unity Catalog y fundamentos de Lakehouse. El curso es avanzado y está orientado a equipos que ya trabajan o van a trabajar en Databricks.
Sí. MLflow 3 es una parte central del curso: tracing, evaluación, feedback humano, versionado, scorers, datasets, monitorización y seguimiento de calidad durante desarrollo y producción.
Sí. El curso cubre Databricks Apps como opción recomendada para agentes con mayor control sobre código, configuración y experiencia. También se compara con Model Serving cuando el caso requiere endpoint API.
Sí. Se trabaja despliegue de agentes en endpoints, empaquetado de código, permisos, inference tables, consumo vía API, escalado, errores, latencia y contrato de integración.
Sí. Unity Catalog se trata como base de gobierno y Vector Search como pieza clave para agentes RAG. Se trabajan catálogos, permisos, volúmenes, tablas, documentos, embeddings, índices y metadata.
Sí. El curso incluye MCP tools, herramientas externas, code interpreter con Python, funciones de Unity Catalog como soporte legacy y criterios de seguridad para cada herramienta.
Sí. Agent Bricks aparece como bloque avanzado para acelerar agentes especializados, comparando cuándo conviene usarlo frente a desarrollo custom y cómo incorporarlo al gobierno corporativo.
Sí. El enfoque principal son agentes internos y empresariales: soporte, datos, finanzas, operaciones, compliance, desarrollo, documentación y asistentes sobre conocimiento corporativo.
Sí. Hay bloques específicos sobre permisos, Unity Catalog, datos sensibles, secrets, tool misuse, prompt injection, filtros de recuperación, respuestas no autorizadas y evaluación adversarial.
Sí. El Proyecto Final puede orientarse a documentación interna, datos corporativos, BI, soporte, operaciones, finanzas, legal, producto o cualquier caso GenAI de la empresa con datos anonimizados.
Sí, esta formación puede ser bonificable hasta el 100% a través de FUNDAE, siempre que la empresa disponga de crédito formativo suficiente y se cumplan los requisitos de comunicación, asistencia y documentación exigidos.
Diseñemos hoy el curso que tu empresa necesita
Cuéntanos tus objetivos de negocio y prepararemos una propuesta formativa bonificable totalmente ad hoc
3 for GenAI, scorers, judges, datasets y feedback humano permiten medir groundedness, relevancia, seguridad, correctness, coste y latencia. Esto evita depender solo de impresiones subjetivas sobre si el agente “parece funcionar”.
2
Refuerza seguridad y control de datos El curso incorpora Unity Catalog, permisos mínimos, filtros de recuperación, secrets, tool governance, prompt injection testing y retención de trazas. Así los agentes pueden acceder a datos empresariales sin abrir riesgos innecesarios.
3
Facilita operación y monitorización en producción Inference tables, AI Gateway, MLflow traces, Lakehouse Monitoring, dashboards y runbooks permiten revisar qué ocurre con los agentes en producción. Esto mejora soporte, troubleshooting, optimización y mejora continua.
4
Integra desarrollo, datos, IA y plataforma Los agentes Databricks requieren colaboración entre data engineering, ML engineering, plataforma, seguridad y negocio. El curso crea un lenguaje común para que todos participen en diseño, evaluación y operación.
5
Prepara una estrategia escalable de agentes La formación no se queda en un agente aislado. Incluye multi-agent systems, Agent Bricks, estándares, CoE, CI/CD, gobierno, costes y patrones reutilizables para escalar agentes en varias áreas de la empresa.
Después de la formación en directo, los alumnos podrán acceder a ejercicios prácticos para aplicar lo trabajado en clase y consolidar el aprendizaje con actividades guiadas.
Acceso a las grabaciones
Los alumnos podrán revisar las sesiones grabadas para repasar conceptos clave, recuperar explicaciones concretas o reforzar aquellos contenidos que necesiten después de la clase en directo.
Recursos formativos
Materiales, sesiones grabadas y documentación de apoyo quedan centralizados en la plataforma para que el equipo pueda consultarlos durante y después de la formación.
Confirmación de asistencia
La plataforma permite registrar y confirmar la asistencia de los participantes, facilitando el seguimiento de la formación y la gestión documental necesaria para la bonificación FUNDAE.
Ejercicios prácticos
Después de la formación en directo, los alumnos podrán acceder a ejercicios prácticos para aplicar lo trabajado en clase y consolidar el aprendizaje con actividades guiadas.
Practica y mejora con nuestra plataforma
Una plataforma practica, con IA integrada y pensada para que mejores desarrollando. Se adapta a tu ritmo, te corrige al instante y te muestra tu progreso real.
Correccion magica
Feedback inteligente
Aprende de cada acierto y fallo con explicaciones claras
Los arquitectos obtendrán una visión completa para decidir cómo encajar agentes en Databricks Apps, Model Serving, Unity Catalog, Vector Search, AI Gateway, Lakehouse Monitoring, permisos y patrones multiagente. La formación permite diseñar arquitecturas escalables y gobernadas.
Desarrolladores backend y equipos de producto IA
Los desarrolladores que construyen aplicaciones con LLM podrán utilizar Databricks como backend de agentes, integrando herramientas, APIs, datos empresariales, endpoints, feedback, trazas y despliegue. El curso conecta ingeniería de software con operación GenAI.
Equipos MLOps, DevOps y Platform Engineering
Los equipos responsables de despliegue, observabilidad, seguridad y operación aprenderán a versionar, desplegar, monitorizar y mantener agentes en Databricks. La formación cubre CI/CD, permisos, serving, Apps, trazas, endpoints, logs, costes y runbooks.
Responsables de gobierno, seguridad y cumplimiento
Los perfiles de seguridad y gobierno podrán revisar cómo se aplican Unity Catalog, permisos, aislamiento, datos sensibles, herramientas, trazas, inference tables, auditoría y políticas internas cuando los agentes acceden a datos y ejecutan acciones.