Deutsch
Dieser Vortrag wird auf Deutsch gehalten. / This Talk will be held in German.

Site Reliability Engineering (SRE) hat sich in den vergangenen Jahren als moderner Ansatz für den Betrieb verteilter Systeme etabliert. Im Zuge des Workshops werden die Teilnehmer:innen in relevante Konzepte von SRE wie z.B. Service Level Objectives (SLOs), Postmortems und Root-Cause-Analysen eingeführt.

Als Roter Faden wird uns dabei die "SRE Pyramid" aus dem Google-SRE-Buch dienen, deren einzelne Themen in Blöcken bearbeitet werden.

Die erlernten Konzepte und Ideen werden wir durch Beispiele, Gruppenarbeiten und Diskussionen vertiefen. Am Ende sollen die Teilnehmer:innen ein pragmatisches und Tool-agnostisches Verständnis von SRE mitnehmen, das sie auch in ihrem eigenen Alltag einsetzen können.

Grundkenntnisse im Betrieb von Verteilten Systemen
Grundkenntnisse Verteilter Systeme
Grundkenntnisse von Kubernetes sind hilfreich für das Nachvollziehen der Beispiele

Motivieren der Teilnehmer:innen, sich mit dem Thema SRE auseinanderzusetzen
Vermitteln relevanter Bausteine für dein eigenen Einsatz
Vermitteln von Best Practices und Lessons Learned aus unserer eigenen Erfahrung
Ausblick wo es mit dem Thema hingehen kann

ab 09:00 Uhr: Registrierung und Begrüßungskaffee
10:00 - 10:30 Uhr: Beginn, Vorstellung
10:30 - 11:30 Uhr: Grundbegriffe und Konzepte von SRE
11:30 - 12: 30 Uhr: Monitoring / Observability
12:30 - 13:30 Uhr: Mittagspause
13:30 - 15:00 Uhr: Incident Response, Post Mortems und Root Cause Analysen
15:00 - 15:15 Uhr: Kaffeepause
15:15 - 16:15 Uhr: Testing und Release Prozesse
16:15 - 16:30 Uhr: Kaffeepause
16: 30 - 17:00 Uhr: Ausblick auf weitere relevante Themen
ca. 17:00 Uhr: Ende

Eigener Laptop
Kostenloser Miro-Account (wir werden Miro als virtuelles Board während des Workshops verwenden)
Optional: Lokale kubectl-Installation für das Nachvollziehen von Beispielen

Bastian Spanneberg

arbeitet seit einigen Jahren im Bereich Site Reliability Engineering, unter anderem bei Unternehmen wie Instana und Clickhouse. Aktuell ist er SRE Lead bei Celonis.

Marcel Birkner

arbeitet seit einigen Jahren im Bereich Site Reliability Engineering, unter anderem bei Unternehmen wie Instana und Clickhouse. Aktuell ist er Founding Engineer in einem Stealth Startup.

Einführung in Site Reliability Engineering

CLC-Newsletter

Einführung in Site Reliability Engineering

Agenda

CLC-Newsletter