C O N S U L T I N G
Site Reliability Engineer
Frankfurt am Main, Deutschland
Hybrid
Ein etabliertes IT-Team mit Start-Up Mentalität sucht dich: Als Site Reliability Engineer (SRE) unterstützt du den stabilen Betrieb einer unternehmenskritischen Plattform - Mit modernem Stack, viel Gestaltungsspielraum und einer offenen Kultur. Du arbeitest eng mit den Entwicklungsteams zusammen, bringst SRE-Prinzipien auf die Straße und hilfst dabei, operativ Exzellenz neu zu definieren.
Deine Rolle:
Du entwickelst Standards, Mechanismen und Tools zur Sicherstellung von Stabilität, Skalierbarkeit und Transparenz der Plattform.
Du begleitest den Aufbau von SLOs/SLAs, Monitoring-Architekturen (OpenTelemetry, Grafana) und Alerting-Strukturen.
Du bist Ansprechpartner bei Incidents, führst Post-Mortem-Analysen durch und setzt proaktiv Maßnahmen zur Verbesserung um.
Du automatisierst Infrastrukturprozesse (Infrastructure as Code), unterstützt das Troubleshooting und betreibst systematische Ursachenanalysen.
Du arbeitest eng mit Cloud Engineers, Test/Release, ITSM und Softwareentwicklern zusammen eingebettet in ein interdisziplinäres Plattformteam von rund 60 Kollegen.
Was du mitbringst:
Abgeschlossenes Studium der Informatik oder eine vergleichbare Qualifikation.
Mehrjährige Erfahrung in der Rolle als SRE, DevOps Engineer oder vergleichbarer Position in einem komplexen Systemumfeld.
Fundierte Kenntnisse in Azure, Kubernetes, IaC (z. B. Terraform) und Monitoring/Logging-Tools (z. B. OpenTelemetry, Prometheus, Grafana).
Erfahrung im Umgang mit Incidents, der Definition technischer Betriebskennzahlen (SLOs/SLAs) und in der Zusammenarbeit mit Dev-Teams.
Ausgeprägte Hands on Mentalität, analytisches Denken und strukturierte Herangehensweise
Sehr gute Deutschkenntnisse (mind. C1) sowie die Bereitschaft, regelmäßig vor Ort in Frankfurt zu arbeiten.
Was dich erwartet:
Hybrides Arbeitsmodell: 2–3 Tage pro Woche vor Ort, sonst flexibel remote.
Moderne Arbeitsplätze: hochwertige Ausstattung, frische Kantine, hauseigenes Café im Herzen Frankfurts.
Wirkungsumfeld: Verantwortung für zentrale Systeme, die täglich von über 18.000 Beratern genutzt werden.
Teamkultur: offene Kommunikation, fachlicher Austausch, Feedbackkultur geführt von erfahrenen Leadern mit technischer Tiefe.
Sicherheit & Freiraum: Ein stabiles Umfeld mit Start-up-naher IT-Dynamik – keine BaFin-Regulatorik
Zusatzleistungen: Deutschlandticket, JobRad, Wellpass, betriebliche Altersvorsorge, 30 Urlaubstage + 24. & 31.12. frei.
Bereit, Plattformverantwortung zu übernehmen und die IT-Landschaft von morgen mitzugestalten.
Dann melde dich bei uns - Wir erzählen dir mehr über das Setup, die Vision und warum jetzt der perfekte Zeitpunkt für den Einstieg ist.
#SRE #Azure #Kubernetes #DevOps #Observability #HybridJob #Frankfurt #ITPlattform #StabilitätMitWirkung