Envíanos tu consulta
Términos y condiciones *
logoImagina
Formación
Modalidades
Próximas Convocatorias
Temario
FAQ
Solicitar información
iconoCurso

Curso de HayStack

DISPONIBLE EN MODALIDAD:
aMedidaIcon
Aula Virtual Personalizada
arrowRightDark

Domina HayStack, el framework de búsqueda avanzada y análisis de texto, implementando pipelines personalizados, integrando modelos de lenguaje y optimizando bases de conocimiento. Este curso práctico te lleva desde configuraciones básicas hasta proyectos reales.

iconClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClienticonClient

Formación en HayStack bonificable para empresas

A quién va dirigido nuestro curso de HayStack

Desarrolladores, científicos de datos e ingenieros interesados en construir sistemas de búsqueda avanzada y análisis de texto con aprendizaje automático.

Objetivos de nuestro curso de HayStack

  • Comprender los fundamentos de HayStack como un framework de búsqueda y su integración en proyectos modernos.
  • Configurar entornos para implementar soluciones de búsqueda avanzadas y análisis de texto.
  • Implementar pipelines de búsqueda con técnicas de recuperación aumentada y aprendizaje automático.
  • Dominar la creación y gestión de bases de conocimiento mediante HayStack.
  • Integrar modelos de lenguaje y herramientas externas para potenciar la búsqueda contextual.

Qué vas a aprender en nuestro curso de HayStack

Domina HayStack, el framework de búsqueda avanzada y análisis de texto, implementando pipelines personalizados, integrando modelos de lenguaje y optimizando bases de conocimiento. Este curso práctico te lleva desde configuraciones básicas hasta proyectos reales.

Requisitos de nuestro curso de HayStack

  • Conocimientos en Python, bases de datos y desarrollo de aplicaciones web.
  • Herramientas necesarias: Python 3.8 o superior, Docker, un editor de texto como Visual Studio Code y acceso a un servidor Elasticsearch u OpenSearch.
  • Mínimo de 8 GB de RAM, procesador multinúcleo y conexión estable a Internet.
  • Licencias gratuitas para herramientas de código abierto como HayStack, y acceso a modelos de lenguaje preentrenados (e.g., Hugging Face).

Temario del curso de HayStack

tema 1

Introducción a HayStack

  • Conceptos básicos de búsqueda avanzada y recuperación de información
  • Ventajas de usar HayStack frente a otros frameworks
  • Instalación de HayStack en un entorno Python
  • Introducción a la arquitectura de HayStack
  • Revisión de casos de uso principales de HayStack
  • Componentes clave: Document Store, Retriever y Reader
  • Ejercicio práctico: Instalación y configuración inicial
  • Exploración de la documentación oficial
  • Requisitos previos para comenzar un proyecto con HayStack
  • Diferencias entre Elasticsearch y OpenSearch en HayStack
iconArrowDown
tema 2

Configuración del Entorno de Trabajo

  • Instalación de dependencias con pip y Docker
  • Configuración de un servidor Elasticsearch para HayStack
  • Integración de un IDE como Visual Studio Code para desarrollo
  • Configuración básica de Python para proyectos con HayStack
  • Uso de Jupyter Notebook para pruebas y prototipos
  • Creación de un entorno virtual con venv o conda
  • Ejercicio práctico: Configuración de un pipeline básico
  • Instalación de modelos de lenguaje desde Hugging Face
  • Depuración y solución de problemas iniciales
  • Mejores prácticas para estructurar proyectos HayStack
iconArrowDown
tema 3

Almacenamiento y Gestión de Documentos

  • Introducción al concepto de Document Store
  • Configuración de bases de datos compatibles: Elasticsearch, SQL y FAISS
  • Indexación de documentos en formatos como JSON, TXT y PDF
  • Ejercicio práctico: Creación de un índice en Elasticsearch
  • Optimización de consultas a bases de datos
  • Gestión de grandes volúmenes de datos en HayStack
  • Limpieza y preprocesamiento de documentos antes de la indexación
  • Configuración de múltiples Document Stores en un mismo proyecto
  • Uso de filtros para búsquedas específicas
  • Pruebas de rendimiento en consultas de Document Store
iconArrowDown
tema 4

Recuperadores (Retrievers) en HayStack

  • Introducción a los retrievers basados en texto y embeddings
  • Configuración de retrievers TF-IDF
  • Integración de retrievers basados en Dense Passage Retrieval (DPR)
  • Ejercicio práctico: Implementación de un retriever denso
  • Comparación entre distintos tipos de retrievers
  • Configuración de retrievers híbridos para mejorar precisión
  • Uso de modelos preentrenados para embeddings en retrievers
  • Personalización de pipelines con múltiples retrievers
  • Evaluación de rendimiento de un retriever
  • Mejores prácticas en selección de retrievers para casos de uso específicos
iconArrowDown
tema 5

Lectores (Readers) y Modelos de Lenguaje

  • Introducción a los lectores basados en modelos de lenguaje
  • Configuración de modelos preentrenados como BERT y RoBERTa
  • Uso de modelos desde Hugging Face para preguntas y respuestas
  • Ejercicio práctico: Implementación de un lector para búsquedas contextuales
  • Comparación de lectores según velocidad y precisión
  • Personalización de modelos para adaptarse a dominios específicos
  • Uso de lectores para generar resúmenes de documentos
  • Configuración avanzada de lectores en pipelines complejos
  • Evaluación de precisión y recall en respuestas generadas
  • Mejores prácticas en tuning de modelos de lenguaje
iconArrowDown
tema 6

Pipelines de Búsqueda Personalizados

  • Introducción a los pipelines en HayStack
  • Configuración de pipelines básicos con Document Store, Retriever y Reader
  • Ejercicio práctico: Creación de un pipeline de preguntas y respuestas
  • Optimización de pipelines para rendimiento en tiempo real
  • Configuración de pipelines avanzados con múltiples nodos
  • Uso de pipelines paralelos para grandes volúmenes de datos
  • Integración de transformadores personalizados en pipelines
  • Configuración de filtros avanzados para búsquedas específicas
  • Depuración y mejora continua de pipelines
  • Documentación y pruebas de pipelines en entornos colaborativos
iconArrowDown
tema 7

Integración con Herramientas Externas

  • Uso de APIs externas con HayStack
  • Integración con herramientas de visualización como Kibana
  • Ejercicio práctico: Visualización de datos de búsqueda en dashboards
  • Uso de herramientas de almacenamiento distribuido para Document Store
  • Configuración de servicios RESTful para búsquedas
  • Integración con aplicaciones web mediante Flask o FastAPI
  • Uso de HayStack con plataformas cloud como AWS y GCP
  • Automatización de procesos con scripts en Python
  • Conexión con sistemas de recomendación mediante HayStack
  • Mejores prácticas en integración con herramientas empresariales
iconArrowDown
tema 8

Evaluación y Mejora Continua

  • Métricas clave para evaluar pipelines de búsqueda
  • Uso de herramientas para análisis de precisión y recall
  • Ejercicio práctico: Evaluación de un pipeline con datos reales
  • Identificación de cuellos de botella en pipelines
  • Optimización de pipelines mediante ajustes iterativos
  • Creación de datasets de prueba para evaluación continua
  • Herramientas para visualización de métricas en tiempo real
  • Comparación de rendimiento entre distintas configuraciones
  • Automatización de pruebas de evaluación
  • Documentación de mejoras y resultados en proyectos colaborativos
iconArrowDown
tema 9

Proyecto Práctico: Construcción de un Sistema Completo de Búsqueda

  • Definición de requisitos para un sistema de búsqueda empresarial
  • Configuración de un Document Store en Elasticsearch
  • Implementación de un pipeline híbrido con retrievers y readers
  • Ejercicio práctico: Optimización de búsquedas para casos específicos
  • Integración de pipelines con una aplicación web mediante FastAPI
  • Configuración de visualización de resultados en tiempo real
  • Evaluación del sistema en un entorno colaborativo
  • Documentación del flujo de trabajo y resultados obtenidos
  • Mejores prácticas para la presentación de proyectos
  • Conclusión y pasos futuros para optimizar sistemas con HayStack
iconArrowDown