Ausgangslage: rund 100 Docker-Container auf VMs in einem VMware vSphere Cluster – funktionierend, aber aufwändig im Betrieb und schwer skalierbar. Ziel: vollständig automatisierte Cloud-Infrastruktur auf GCP mit Kubernetes.
GCP war eine bewusste Entscheidung – vorhandene Erfahrung im Team, und die Kubernetes Control Plane war damals noch kostenfrei. Ein Timing-Detail am Rande: kurz nach dem Go-live hat Google das geändert.
Die Infrastruktur wurde mit Terraform und Ansible vollständig als Code umgesetzt, CI/CD über Argo CD. Besonders hervorzuheben: Argo CD als Self-Service für das Entwicklungsteam – Entwickler konnten sich Dev- und Test-Umgebungen eigenständig zusammenklicken, ohne Ops-Ticket. Die Architektur war auf Error Budgets und SRE-Prinzipien ausgelegt – der nächste konsequente Schritt, der allerdings nicht mehr live gegangen ist.
Das Projekt lief von März bis September, parallel zum laufenden Betrieb. Das Team war klein – zwischen zwei und vier Personen, mit Fluktuation. Der erfahrene Kern ist geblieben und hat das Projekt getragen. Meine Rolle war strategisch: Projektleitung, Architekturentscheidungen, externe Präsentation – weniger hands-on, mehr als Agile Coach und technischer Sparringspartner.
Ergebnis: vollständig automatisierte Cloud-Infrastruktur, Betriebskosten halbiert, Entwicklungsteam mit echtem Self-Service.