10.09.2025 aktualisiert

**** ******** ****

Data Engineer

Würzburg, Deutschland
Deutschland
B.Sc. Computer Science
Würzburg, Deutschland
Deutschland
B.Sc. Computer Science

Profilanlagen

Projekthistorie_Steven_Glauer.pdf

Skills

Künstliche IntelligenzConfluenceMicrosoft AzureBig DataCloud ComputingContinuous IntegrationETLPythonMicrosoft Sql-ServerScrumSQLTransact-SqlTestenGitPandasPysparkScikit-learnDatabricks
Programmierung 
  • Python 
  • Java 
  • TypeScript 
Datenbanken 
  • SQL (T-SQL) 
  • Microsoft SQL Server 
  • PostgreSQL 
Cloud-Computing 
  • Microsoft Azure
Big Data & Datenverarbeitung 
  • Azure Data Lake 
  • Azure Databricks (inkl. PySpark) 
  • Unity Catalog 
  • Azure Data Factory 
  • ETL (Extract, Transform, Load) 
  • Data Warehousing 
  • Azure Log Analytics 
  • Azure Monitor 
  • Azure Key Vault 
Business Intelligence 
  • Power BI 
  • Tabular Models 
  • Azure AI Search 
  • Azure Service Bus 
Maschinelles Lernen 
  • Python (scikit-learn, seaborn, pandas, pyspark) 
  • Azure OpenAI Service 
  • Azure KI Foundry 
  • MLFlow 
  • Langchain 
CI/CD & DevOps 
  • Azure DevOps (Pipelines, Repos, Boards) 
  • Git, GitLab 
  • CI/CD mit YAML 
  • Automatisiertes Testing und Deployment 
  • Scrum, Confluence, Jira 
Zertifikate 
  • Microsoft Certified: Azure Data Engineer Associate – Exam DP-203 
  • Microsoft Certified: Azure AI Fundamentals – Exam AI-900 
  • Microsoft Certified: Azure Solutions Architect Expert – Exam AZ-305 
Fremdsprachen 
  • Deutsch (Muttersprache) 
  • Englisch (fließend) 

Sprachen

DeutschMuttersprache

Projekthistorie

Machine Learning Engineer (GenAI)

Mercedes-Benz Tech Innovation

Internet und Informationstechnologie

1000-5000 Mitarbeiter

Erstellung einer API-Schnittstelle, die es ermöglicht, folgende AI-basierte Anfragen durchzuführen, unter Verwendung des Azure OpenAI Service mit GPT 3.5/4 und dem Aufbau des Services mithilfe von LangChain:
  1. Email Classification:
    • Klassifizierung eingehender E-Mails, um diese automatisch an die richtige Stelle im Unternehmen weiterzuleiten. Die E-Mails werden zur besseren Weiterverarbeitung in Kategorien wie Feedback, Aktion notwendig (Ja/Nein), oder Spam eingeteilt.
    • Evaluierung der Ergebnisse mit einem Testdatenset, unter Verwendung von Metriken wie Accuracy, Precision, Recall und F1-Score, mit Unterstützung durch MLFlow.
  2. AI-supported Case Summary:
    • Erstellung einer Zusammenfassung von Kunden-E-Mails und deren Anhängen unter Berücksichtigung rechtlicher Richtlinien.
    • Evaluierung der Zusammenfassungen anhand von Rouge-1, Rouge-2 und weiteren gängigen Metriken wie Correctness, Faithfulness, Context Relevancy, Guideline Adherence und Embedding Semantic Similarity.
  3. Answer Customer Questions (RAG):
    • Beantwortung häufig gestellter Kundenfragen, die mithilfe von Benutzerhandbüchern und anderen Ressourcen beantwortet werden können.
    • Evaluierung der Antworten anhand von Rouge-1, Rouge-2 sowie weiteren Metriken wie Correctness, Faithfulness, Context Relevancy, Guideline Adherence und Embedding Semantic Similarity.
Vorteile der Lösung:
  • Schnellere Antwortzeiten auf Kundenanfragen.
  • Entlastung der Mitarbeiter durch Automatisierung wiederkehrender Aufgaben.
  • Übersichtliche Auswertung der Modell-Ergebnisse in einem Grafana-Dashboard.


Kenntnisse: Microsoft Azure , OpenAIService , ChatGPT, Langchain, MLFlow, Python, Confluence

Data Engineer

Mercedes--Benz Tech Innovation

Internet und Informationstechnologie

1000-5000 Mitarbeiter

- Aufbau des Greenfield Projektes (Databricks, Azure Monitoring, Delta Lake)
- Aufbau eines Data Warehouses
- Berechnen der Kennzahlen in Databricks
- Erstellen eines Monitoring Dashboards
- Erstellen eines PowerBI Berichts
- Schulen von Mitarbeiter in Bezug auf Azure

Kenntnisse: Serverless Computing · Englisch · Azure Data Lake · Azure Databricks · Azure DevOps · Microsoft Power BI

Data Engineer

Heringer Consulting GmbH

Telekommunikation

50-250 Mitarbeiter

- Historisierung des Data Warehouses
- Anpassen des Workloades der Data Factory
- Berechnen der neuer Kennzahlen des Krankheitsberichts mit T-SQL
- Erstellen eines Krankheitsbericht in PowerBI

Kenntnisse: Serverless Computing · Azure Data Factory · Azure DevOps · Microsoft Power BI · SQL Azure · TransactSQL (T-SQL)

Zertifikate

Microsoft Certified: Azure AI Fundamentals

Microsoft

2023

Microsoft Certified: Azure Data Engineer Associate

Microsoft

2023


Kontaktanfrage

Einloggen & anfragen.

Das Kontaktformular ist nur für eingeloggte Nutzer verfügbar.

RegistrierenAnmelden