Dieser Vortrag wird auf Deutsch gehalten. / This Talk will be held in German.
Site Reliability Engineering (SRE) hat sich in den vergangenen Jahren als Ansatz für den verlässlichen Betrieb verteilter Systeme etabliert.
Im Verlauf des Workshops werden die Teilnehmer SRE-Prinzipien und die SRE-Pyramide kennen lernen und im Wechsel von Theorie und interaktiven Elementen die Bereiche Monitoring und Observability, Incident Response sowie Post Mortems und Root-Cause-Analysen vertiefen.
Am Ende sollen die Teilnehmer ein Tool-agnostisches Verständnis von SRE mitnehmen, das sie auch in ihrem eigenen Arbeitsalltag einsetzen können.
Teilnehmer sollten ein Grundverständnis für Architektur und Betrieb moderner und verteilter Applikationen mitbringen.
Bei den Teilnehmern soll das Interesse für SRE geweckt werden. Die SRE-Konzepte sollen anhand von Best Practices sowie Gruppendiskussionen und -arbeiten in einer Weise vermittelt werden, dass sie auch im eigenen Kontext einsetzbar sind.
- 9:00 - 10:00 Uhr: Ankunft und Begrüßungskaffee
- 10:00 - 11:00 Uhr: Einführung
- Vorstellung
- Die Geschichte von SRE und die SR- Prinzipien
- SRE im aktuellen Kontext (DevOps, Platform Engineering, DevEx)
- 11:00 - 12:30 Uhr: Grundlagen der SRE Pyramide
- Monitoring
- Incident Response
- Post Mortems und Root Cause Analysis
- 12:30 - 13:30 Uhr: Mittagspause
- 13:30 - 15:00 Uhr: Hands-On Block
- Exploratives Debugging der Demo-Anwendung
- Identifizieren von Problemen und Tool-Lücken
- Evaluieren von Lösungen und gemeinsame Verbesserungen
- 15:00 - 15:15 Uhr: Kaffeepause
- 15:15 - 17:00 Uhr: Hands-On Block und/oder Open Space
- Chaos Engineering und Incident Response
- Optional: Open Space zum gemeinsamen Diskutieren von Fragen/Themen der Teilnehmer
- ca. 17:00 Uhr: Ende des Workshops
Pausenzeiten
- ab 09:00 Uhr: Registrierung und Begrüßungskaffee
- 10:00 Uhr: Beginn
- 12:30 - 13:30 Uhr: Mittagspause
- 15:00 - 15:15 Uhr: Kaffeepause
- 16:15 - 16:30 Uhr: Kaffeepause
- ca. 17:00 Uhr: Ende
- Eigener Laptop mit aktuellem Browser
- Kostenloser Miro-Account
- Optional: lokale kubectl Installation für die Interaktion mit dem Demo-Cluster und der Demo-Anwendung

