21.10.2025 aktualisiert


Senior Berater & Projektmanager - AIOps, MLOps & KI | Monitoring | ITIL | DevOps
Skills
Ich übernehme Verantwortung in komplexen Systemlandschaften mit heterogenen Stakeholdern – von klassischem IT-Betrieb über agile DevOps-Teams bis hin zu regulatorisch geprägten Organisationen mit hohen Anforderungen an Nachvollziehbarkeit und Compliance. Mein Schwerpunkt liegt auf der Operationalisierung moderner IT-Praktiken: von SLIs, SLOs und KPIs über automatisiertes Monitoring und Event Management bis hin zu intelligenter Ursachenanalyse und Alert-Optimierung.
Als Technical Owner entwickle ich robuste, dokumentierte und tragfähige Betriebsmodelle – pragmatisch, teamorientiert und mit dem Fokus auf nachhaltige Umsetzbarkeit. Ich begleite interdisziplinäre Teams methodisch (Scrum, PRINCE2, ITIL), moderiere technische Zielkonflikte, unterstütze das Erwartungsmanagement und bereite komplexe Sachverhalte für Management und Fachbereiche verständlich auf.
Zertifiziert in DevOps Leadership, ITIL, PRINCE2, Azure AI und Google Generative AI, Instana, watsonx mit tiefer Tool- und Plattformkenntnis in Cloud-, Container- und KI-Umgebungen. Branchenexpertise in Versicherung, Automotive, Bahn, öffentlichem Sektor und IT-Dienstleistung.
Sprachen
Projekthistorie
APM-, Observability- und Instana-Rollout
- Integration und Skalierung von Instana in die bestehende hybride IT-Landschaft zur Optimierung der Observability und Performance-Überwachung.
- Monitoring-Rollout mit Fokus auf neue SLIs, SLOs und KPIs zur zielgerichteten kontinuierlichen Überwachung der hybriden Systemlandschaft.
- Erweiterung der Verfügbarkeitsüberwachung durch neue Operator-Prozesse im Kontext einer vorangegangenen Kubernetes-Migration.
- Operationalisierung eines optimierten Störungsmanagement-Modells mit einer automatisierten Tool-Kette – von der Anomalie-Erkennung in Instana über Dashboarding in Grafana bis zur Ticket-Erstellung in Cherwell.
- Implementierung automatisierter Überwachungsmetriken für 300 neu eingebundene Systeme durch gezielte Nutzung von Instana In-Built Events.
- Unterstützung bei der Evaluierung und Integration von SAP in die neue Observability-Plattform unter Einsatz von OpenTelemetry.
- Enge Zusammenarbeit mit dem Application Lifecycle Management, um Governance-Vorgaben effizient in den Regelbetrieb zu überführen.
- Aufbau eines strukturierten Reportings sowie Etablierung standardisierter Prüfmechanismen zur Konsolidierung des neuen ITSM-Ablaufmodells.
Neues Betriebsmodell für Monitoring & Event Management
- Weiterentwicklung des unternehmensweiten Monitoring-Standards im Rahmen der übergeordneten IT-Strategie.
- Stärkung einer einheitlichen Monitoring-Governance durch die gezielte Integration von Instana als Ergänzung zu CheckMK und weiteren Tools.
- Definition und Verfeinerung von Metriken sowie Service-Level-Zielen (SLOs) als Grundlage für ein effektives Monitoring und Reporting.
- Enge Zusammenarbeit mit Produkt- und Projektteams, um Performance-Anforderungen an die Systemüberwachung sicherzustellen.
- Regelmäßige Überprüfung und Berichterstattung zur Service-Qualität im Einklang mit den Projektzielen.
Roadmap Event Management & Monitoring 2025+
- Entwicklung einer zukunftsorientierten Strategie für Observability, Monitoring und Event Management (EVM) über 2025 hinaus.
- Weiterentwicklung der EVM-Governance zur langfristigen Sicherstellung einer nachhaltigen und effizienten Überwachung hybrider IT-Umgebungen.
- Analyse und Ausbau von Machine-Learning-gestützten Methoden für Predictive Monitoring und automatisierte Event-Klassifikation.
- Bewertung und Planung der Skalierung des Monitoring-Frameworks zur optimalen Unterstützung zukünftiger Cloud- und SaaS-Workloads.
- Entwicklung eines Nutzungskonzepts für OpenTelemetry zur Stärkung der Herstellerunabhängigkeit und Minimierung des Vendor Lock-in.
- Erarbeitung von Strategien zur Reduktion von Alert-Noise mit dem Ziel, die Signal-to-Noise-Ratio zu verbessern.
Systemüberwachung (Observability, Monitoring & Reporting)
- Durchführung von Predictive Analytics zur Vorhersage erwarteter Lasten, Fehlerraten und Latenzen vor dem Übergang zur neuen Vertriebsplattform, wodurch spezifische Kapazitätsgrenzen identifiziert und durch präventive Maßnahmen die Auslastung um mehr als 40% reduziert werden konnte.
- Konzeption, Implementierung und regelmäßige Aktualisierung zahlreicher Dashboards für Application Performance Monitoring (APM), Systemverfügbarkeit und Cloud-Kosten.
- Entwicklung grundlegender Strategien zur Minimierung von Falschalarmen durch die Analyse bestehender Alarmierungen.
- Regelmäßige Koordination der Zusammenarbeit mit relevanten Stakeholdern zu Monitoring-Themen über Teamgrenzen hinweg.
- Steigerung der Monitoring-Präzision durch Feinabstimmung von Metriken und Optimierung wichtiger KPIs.
- Entwicklung übergreifender Monitoring-Strategien und -Dashboards im Vorfeld der Cloud-Transformation und deren nahtlose Übernahme in den regulären Betrieb.
- Mitarbeit an Ansätzen zur Optimierung der Anomalie-Erkennung mittels maschinenlerngestützten Verfahren auf Plattformen wie Splunk und Instana.
- Tägliches Reporting wichtiger Betriebskennzahlen in zentralen Meetings während der Testphasen und in der kritischen Phase des Hochlaufs der neuen Vertriebsplattform, basierend auf einem tiefgreifenden Verständnis der eingesetzten Tools wie Splunk, Instana, Grafana sowie Atlassian Jira & Confluence.
- Aktive Beteiligung am klassischen ITIL-Change-Management-Prozess, einschließlich der Erstellung und Koordination von Änderungsanträgen sowie deren Genehmigungen.
- Unterstützung bei der Klärung von Unklarheiten und der Minimierung von Verzögerungen im Change-Prozess.
- Dokumentation bestehender Verfahren für Change-Freigaben als Grundlage für anstehende Optimierungen gemäß ITIL 4-Vorschriften.
- Kommunikation mit anderen Teams zur Identifizierung und Implementierung von Verbesserungspotenzialen im Change-Management im Kontext der neuen CI/CD-Prozesse.
- Detaillierte Analyse aktueller Change-Prozesse in HP ITSM als Vorarbeit zur Integration in das Jira-System und Konzeptioneller Support zu Beginn der Jira-Migration, einschließlich der Spezifikation von Schnittstellenanforderungen zur Erfüllung der Audit-Erfordernisse des Change-Managements.
- Ausarbeitung von Empfehlungen zur Optimierung der Prozessabläufe, gestützt auf die bestehende Dokumentation und Verfahren im Change-Management.
- Koordination und Durchführung einer Live-Präsentation des Teams bei einer Town-Hall-Veranstaltung mit etwa 400 Anwesenden.
- Entwicklung und Leitung von Workshops zu wichtigen Dashboards der neuen Vertriebsplattform für insgesamt mehr als 150 Personen.
- Vortrag über „übergreifendes Monitoring“ im Rahmen eines Abteilungsmeetings für rund 60 Zuschauer.
- Organisation und Durchführung weiterer Schulungen und Vorträge zur Förderung des Wissensaustauschs und der fachlichen Weiterbildung.
Transition Manager beim Wechsel des IT-Operations Providers für den 24/7-Applikationsbetrieb
- Koordination des Auswahlprozesses für einen neuen IT-Ops-Partner, einschließlich Durchführung des Ausschreibungsverfahrens (RFI, RFQ).
- Vorbereitung, Begleitung und Nachbereitung von Bewerbungsgesprächen zur Auswahl des idealen Providers.
- Strukturierte Bewertung von Bewerberprofilen und Erarbeitung fundierter Empfehlungen für die finale Auswahl.
- Planung und Leitung des Wissenstransfers vom alten zum neuen Provider zur Gewährleistung eines nahtlosen Übergangs.
- Unterstützung des neuen Partners während der Anlaufphase zur Sicherstellung einer stabilen und effizienten Betriebsübernahme.
- Deutliche Senkung der Fehlalarmquote durch umfassende Optimierungsmaßnahmen bei der Alarmierung.
- Einführung von SRE-Verfahren, wie Service Level Objectives und Errorbudgets.
- Erhöhung der Ablaufeffizienz und Abbau von Reibungsverlusten durch Optimierung der Prozess- und Zuständigkeitsmatrix bei der Einführung ITIL-konformer DevOps-Praktiken.
- Erhöhung der Transparenz über Projektrisiken durch Neukonzeption des KPI-Reportings bei den SLA-Abnahmen.
- Durchführung von KT-Sessions zu ITIL, DevOps, SRE und Monitoring zur Vertiefung des Fachwissens im Team.
- Fortlaufende statistische Analysen der ITIL-Prozesse, um kontinuierlich Verbesserungspotenziale zu identifizieren.
- Reduktion der OnSite-Ops-Kapazitäten um 40% im ersten Jahr durch gesteigerte Prozesseffizienz.
- Transition zu agilen ITSM-Praktiken für OnSite- und NearShore-Teams zur Optimierung der Betriebsabläufe.
- Evaluierung eines internen Machine Learning Projekts zur Anomalie-Erkennung bei Prometheus-Metriken.
- Effiziente Koordination des Eskalationsmanagements zur Entlastung technischer Teams bei Rufbereitschaftseinsätzen.
- Organisation und Moderation von internen Schulungen und Workshops zu ITIL-Servicekatalog und DevOps-Methoden.
- Professioneller Einsatz von SQL, PowerBI, Excel, Grafana & Dynatrace zur datengestützten Entscheidungsfindung.
- Reduktion der Cycle-Time im Problemmanagement auf ein Drittel, primär durch kleine Prozessoptimierungen und konsequentes Nachhalten der bereits definierten Prozesse.
- Erreichen des Ziels, das Problembacklog innerhalb eines Jahres um 500% zu reduzieren, dank gesteigerter Prozesseffizienz.
- Entwicklung umfassender Prozessdokumentationen zur Standardisierung und Steigerung der Effektivität.
Zertifikate
watsonx: Technical Essentials
IBM, USA2025
Microsoft Certified: Azure AI Fundamentals
Microsoft, United States2023
IBM AI Foundations for Business
IBM, United States2023
IBM AI Foundations for Business
IBM, United States2023
IBM AI Ladder Essentials
IBM, United States2023
IBM Data Science Orientation
IBM, United States2023
Microsoft Azure Machine Learning
Microsoft, United States2023
Microsoft Artificial Intelligence on Microsoft Azure
Microsoft, United States2023
Microsoft MS-012: Prepare your Organization for Microsoft Copilot
Microsoft, United States2023
Google Cloud Generative AI Fundamentals
Google, USA2023
Google Cloud Introduction to Generative AI
Google, USA2023
Google Cloud Introduction to Responsible AI
Google, USA2023
Google Cloud Introduction to Large Language Models
Google, USA2023
AWS Certified Cloud Practitioner
Amazon Web Services, United States2023
Google Cloud Generative AI Fundamentals
Google, United States2023
Prepare your Organization for Microsoft Copilot (MS-012)
Microsoft, United States2023
Splunk Core Certified User
Splunk Inc., United States2022
DevOps Leader (DOL)®
DevOps Institute, United States2021
PRINCE2® Foundation Certificate in Project Management
AXELOS Limited, London (UK)2020
DevOps Foundation (DOFD)®
DevOps Institute, United States2020
ITIL® Foundation Certificate in IT Service Management
AXELOS Limited, London (UK)2020
SCRUM Product Owner (PSPO I)
Scrum.org, Burlington (USA)2020
SCRUM Master (PSM I)
Scrum.org, Burlington (USA)2020

exali Berufshaftpflicht-Siegel
Das original exali Berufshaftpflicht-Siegel bestätigt dem Auftraggeber, dass die betreffende Person oder Firma eine aktuell gültige branchenspezifische Berufs- bzw. Betriebshaftpflichtversicherung abgeschlossen hat.
Versichert bis: 01.11.2026