About the Role
Diese Tätigkeiten kommen auf Dich zu:
Konzeption, Entwicklung und Betrieb einer skalierbaren, mandantenfähigen Überwachungsplattform
Implementierung und Betrieb von CI/CD-, Release- und Deployment-Prozessen sowie Infrastructure as Code und Cloud-Native-Technologien
Integration und Automatisierung von Monitoring-, Logging- und Tracing-Lösungen
Sicherstellung von Qualität, Resilienz, Security und Compliance durch Tests, Meta-Monitoring und KPIs/SLIs/SLOs
Dokumentation, Reporting und strukturierter Wissenstransfer an Betrieb und Fachbereich
Software Entwicklung
Einsatzort
München, Remote
Arbeitszeit
Vollzeit
Arbeitsbeginn
ab 01.05.2026
Referenznummer
376
Das bringst Du mit:
Mehrjährige Erfahrung im Betrieb und in der Automatisierung skalierbarer Überwachungsplattformen (Kubernetes, GitOps/ArgoCD)
Fundierte Kenntnisse in Infrastructure as Code (Terraform) und Cloud-Native-Technologien
Erfahrung mit Monitoring-, Logging- und Tracing-Lösungen (z. B. Prometheus, Grafana, Loki, Tempo, Mimir) inklusive Alerting-Regeln und Runbooks
Entwicklung von Software-Integrationen, APIs und Kubernetes Operatoren
Erfahrung im Tenant Lifecycle Management
Erfahrung in dem Umgang mit Python
Kenntnisse in SAFe und ITIL sowie modernen Konzepten wie „/dev/null as a Service“ und RDBMS wären von Vorteil
Sehr gute Deutschkenntnisse (min. C1) und gute Englischkenntnisse (min. B1)