Site Reliability Engineer (w/m/d)
bei
unserer Tochtergesellschaft
IONOS SE
in
Berlin
Vollzeit | Unbefristet
Kennziffer: I-1220
Über uns
IONOS ist der führende europäische Digitalisierungs-Partner für kleine und mittlere Unternehmen (KMU). IONOS hat mehr als sechs Millionen Kundinnen und Kunden und ist mit einer weltweit verfügbaren Plattform in 18 Märkten in Europa und Nordamerika aktiv. Mit seinen Web Presence & Productivity-Angeboten agiert das Unternehmen als “One-Stop-Shop" für alle Digitalisierungs-Bedürfnisse - von Domains und Webhosting über klassische Website-Builder und Do-It-Yourself-Lösungen, von E-Commerce bis zu Online-Marketing-Tools. Darüber hinaus bietet IONOS Cloud-Lösungen für Firmen, die im Zuge der Weiterentwicklung ihres Geschäfts in die Cloud wechseln möchten.
Wir suchen einen hochqualifizierten und erfahrenen Site Reliability Engineer, der unser Team im 24/7‑Shift unterstützt. Die SRE‑Abteilung L2 betreibt sämtliche IONOS‑Cloud‑IaaS‑ und PaaS‑Dienste. Als Site Reliability Engineer bist Du für die Stabilität, Sicherheit und Performance unserer komplexen, verteilten Systeme verantwortlich. Du arbeitest eng mit den Entwicklungsteams zusammen, um skalierbare und zuverlässige Infrastrukturen zu entwerfen, zu implementieren und zu betreiben sowie Prozesse zu automatisieren und zu optimieren.
Aufgabenbereich
- Technischer Level‑2‑Support mit direktem Kundenkontakt.
- Pflege von Monitoring‑, Logging‑ und Alerting‑Lösungen (z. B. Prometheus, Grafana, Loki) zur proaktiven Erkennung von Problemen im Schichtbetrieb und Mitwirkung bei der Lösung komplexer Issues in verteilten Systemen.
- Fehlersuche in Netzwerken (LAN/WAN/VPN, DNS, DHCP) und Speichersystemen (File/Object/Block); Bereitstellung und Betrieb hochverfügbarer Services auf Linux und Kubernetes (Helm‑Charts).
- Aufbau und Pflege von Infrastructure‑as‑Code, Automatisierung und Playbooks mit Ansible, Terraform, GitLab CI/CD, Argo CD sowie Skriptsprachen wie Bash, Python und Go.
- Zusammenarbeit mit Entwicklungsteams zur Verbesserung von Prozessen und Deployments sowie zur reibungslosen Integration neuer Services und Applikationen in unsere Cloud‑ und Kubernetes‑Umgebung.
- Gewährleistung eines stabilen und sicheren Plattformbetriebs, inklusive End‑to‑End‑Incident‑Management von der ersten Analyse über die Lösung bis hin zur Nachbearbeitung im Rahmen des Problem‑Managements.
Qualifikationen
- Bereitschaft, in einem 24 × 7‑Schichtmodell zu arbeiten (Nacht‑, Wochenend‑ und Feiertagsdienste) und dabei ein starkes Problem‑Lösungs‑ und Troubleshooting‑Mindset mitzubringen.
- Mehrjährige Erfahrung als Site Reliability Engineer oder in einer verwandten Rolle (Linux‑Systemadministrator, Platform Engineer, DevOps/Infrastructure Engineer, Full‑Stack‑Developer).
- Fundierte Kenntnisse in Automatisierungstools (z. B. Ansible, SaltStack), Monitoring‑ und Observability‑Tools (Prometheus, Grafana, Loki) sowie Logging‑ und Alerting‑Lösungen (ELK‑Stack).
- Erfahrung mit virtualisierten Umgebungen (QEMU/KVM, OpenStack, Proxmox), Cloud‑Storage‑Technologien (File, Object, Block) und sicherer Umgang mit Docker & Kubernetes.
- Sehr gute Kenntnisse in mindestens einer Programmiersprache oder Skriptsprache (Go, Python, Bash) für Automatisierungs‑ und Monitoring‑Aufgaben.
- Erfahrung im Code‑Management (Merge‑Conflicts, Feature‑Branches, Merge‑Requests, CI/CD) ist von Vorteil.
Nice‑to‑have:
- Erfahrung mit RDMA, InfiniBand und RoCE‑Protokollen.
- Tiefe Kenntnisse in Linux MD RAID (mdadm, sedadm) und LVM.
- Expertise in Linux‑Performance‑Tuning und Netzwerk‑Stack‑Debugging (ethtool, perf, tcpdump, ibstat, ibtop).
- Praxis mit S3, Ceph und software‑definierten Netzwerken.
- Erfahrung mit etablierten Software‑Entwicklungspraktiken (Code‑Reviews, Build‑Prozesse, Packaging, Testing).
Sprachkenntnisse: Fließend in Deutsch und Englisch (mindestens B2 nach dem CEFR‑Standard).
Standort: Berlin
Hinweis: Zum Ende des Bewerbungsprozesses müssen Kandidaten einer Sicherheitsüberprüfung unterzogen werden. Dein Einverständnis dafür wird rechtzeitig im Prozess erfragt.
Benefits
- Hybrides Arbeitsmodell.
- Schichtmodell Arbeitszeiten.
- An einigen Standorten eine bezuschusste Kantine und verschiedene kostenfreie Getränke.
- Moderne Büroflächen mit sehr guter Verkehrsanbindung.
- Diverse Mitarbeiterrabatte für Aktivitäten und Produkte.
- Mitarbeiterevents wie Sommer- und Winterfeiern, sowie Workshops.
- Zahlreiche Weiterbildungs- und Entwicklungsmöglichkeiten.
- Verschiedene Gesundheitsangebote, wie Sport- und Gesundheitskurse.
Vielfalt bereichert. Unterschiedliche Kulturen, Nationalitäten, Geschlechter, Altersgruppen, sexuelle Orientierungen und Religionen sowie Menschen mit Behinderungen – wir wünschen uns Vielfalt und fördern sie. Denn nur Teams, die alle Facetten der Gesellschaft widerspiegeln, bieten die besten Rahmenbedingungen für Kreativität und machen ein Unternehmen produktiv und unverwechselbar. Wir wertschätzen Vielfalt und begrüßen alle Bewerbungen.
Kontakt
Fragen?
IONOS SE
Recruiting Team IONOS
Hinterm Hauptbahnhof 3-5
D-76137 Karlsruhe
jobs@ionos.com
Nutzen Sie für Ihre Bewerbung bitte ausschließlich unser unkompliziertes Online-Formular, sodass wir Ihnen einen möglichst transparenten Bewerbungsprozess unter Einhaltung aller datenschutzrechtlicher Vorgaben gewährleisten können. Bewerbungen per Mail können wir leider aus genannten Gründen nicht berücksichtigen.