Curso avanzado sobre Site Reliability Engineering (SRE), abarcando desde los fundamentos hasta la implementación de sistemas confiables y escalables en entornos de producción.
Este curso cubre los principios y prácticas fundamentales del Site Reliability Engineering (SRE), un enfoque moderno para gestionar sistemas de producción de manera eficiente. Los participantes aprenderán cómo implementar SLAs, SLOs y SLIs, automatizar tareas críticas, gestionar incidentes y optimizar la capacidad y escalabilidad de los sistemas distribuidos. El curso incluye prácticas con herramientas líderes en la industria como Prometheus, Grafana y Kubernetes, además de la realización de un proyecto final integrador.
Este curso cubre los principios y prácticas fundamentales del Site Reliability Engineering (SRE), un enfoque moderno para gestionar sistemas de producción de manera eficiente. Los participantes aprenderán cómo implementar SLAs, SLOs y SLIs, automatizar tareas críticas, gestionar incidentes y optimizar la capacidad y escalabilidad de los sistemas distribuidos. El curso incluye prácticas con herramientas líderes en la industria como Prometheus, Grafana y Kubernetes, además de la realización de un proyecto final integrador.