10.09.2025 aktualisiert


Data Engineer
Würzburg, Deutschland
Deutschland
B.Sc. Computer ScienceSkills
Künstliche IntelligenzConfluenceMicrosoft AzureBig DataCloud ComputingContinuous IntegrationETLPythonMicrosoft Sql-ServerScrumSQLTransact-SqlTestenGitPandasPysparkScikit-learnDatabricks
Programmierung
- Python
- Java
- TypeScript
- SQL (T-SQL)
- Microsoft SQL Server
- PostgreSQL
- Microsoft Azure
- Azure Data Lake
- Azure Databricks (inkl. PySpark)
- Unity Catalog
- Azure Data Factory
- ETL (Extract, Transform, Load)
- Data Warehousing
- Azure Log Analytics
- Azure Monitor
- Azure Key Vault
- Power BI
- Tabular Models
- Azure AI Search
- Azure Service Bus
- Python (scikit-learn, seaborn, pandas, pyspark)
- Azure OpenAI Service
- Azure KI Foundry
- MLFlow
- Langchain
- Azure DevOps (Pipelines, Repos, Boards)
- Git, GitLab
- CI/CD mit YAML
- Automatisiertes Testing und Deployment
- Scrum, Confluence, Jira
- Microsoft Certified: Azure Data Engineer Associate – Exam DP-203
- Microsoft Certified: Azure AI Fundamentals – Exam AI-900
- Microsoft Certified: Azure Solutions Architect Expert – Exam AZ-305
- Deutsch (Muttersprache)
- Englisch (fließend)
Sprachen
DeutschMuttersprache
Projekthistorie
Erstellung einer API-Schnittstelle, die es ermöglicht, folgende AI-basierte Anfragen durchzuführen, unter Verwendung des Azure OpenAI Service mit GPT 3.5/4 und dem Aufbau des Services mithilfe von LangChain:
Kenntnisse: Microsoft Azure , OpenAIService , ChatGPT, Langchain, MLFlow, Python, Confluence
- Email Classification:
- Klassifizierung eingehender E-Mails, um diese automatisch an die richtige Stelle im Unternehmen weiterzuleiten. Die E-Mails werden zur besseren Weiterverarbeitung in Kategorien wie Feedback, Aktion notwendig (Ja/Nein), oder Spam eingeteilt.
- Evaluierung der Ergebnisse mit einem Testdatenset, unter Verwendung von Metriken wie Accuracy, Precision, Recall und F1-Score, mit Unterstützung durch MLFlow.
- AI-supported Case Summary:
- Erstellung einer Zusammenfassung von Kunden-E-Mails und deren Anhängen unter Berücksichtigung rechtlicher Richtlinien.
- Evaluierung der Zusammenfassungen anhand von Rouge-1, Rouge-2 und weiteren gängigen Metriken wie Correctness, Faithfulness, Context Relevancy, Guideline Adherence und Embedding Semantic Similarity.
- Answer Customer Questions (RAG):
- Beantwortung häufig gestellter Kundenfragen, die mithilfe von Benutzerhandbüchern und anderen Ressourcen beantwortet werden können.
- Evaluierung der Antworten anhand von Rouge-1, Rouge-2 sowie weiteren Metriken wie Correctness, Faithfulness, Context Relevancy, Guideline Adherence und Embedding Semantic Similarity.
- Schnellere Antwortzeiten auf Kundenanfragen.
- Entlastung der Mitarbeiter durch Automatisierung wiederkehrender Aufgaben.
- Übersichtliche Auswertung der Modell-Ergebnisse in einem Grafana-Dashboard.
Kenntnisse: Microsoft Azure , OpenAIService , ChatGPT, Langchain, MLFlow, Python, Confluence
- Aufbau des Greenfield Projektes (Databricks, Azure Monitoring, Delta Lake)
- Aufbau eines Data Warehouses
- Berechnen der Kennzahlen in Databricks
- Erstellen eines Monitoring Dashboards
- Erstellen eines PowerBI Berichts
- Schulen von Mitarbeiter in Bezug auf Azure
Kenntnisse: Serverless Computing · Englisch · Azure Data Lake · Azure Databricks · Azure DevOps · Microsoft Power BI
- Aufbau eines Data Warehouses
- Berechnen der Kennzahlen in Databricks
- Erstellen eines Monitoring Dashboards
- Erstellen eines PowerBI Berichts
- Schulen von Mitarbeiter in Bezug auf Azure
Kenntnisse: Serverless Computing · Englisch · Azure Data Lake · Azure Databricks · Azure DevOps · Microsoft Power BI
- Historisierung des Data Warehouses
- Anpassen des Workloades der Data Factory
- Berechnen der neuer Kennzahlen des Krankheitsberichts mit T-SQL
- Erstellen eines Krankheitsbericht in PowerBI
Kenntnisse: Serverless Computing · Azure Data Factory · Azure DevOps · Microsoft Power BI · SQL Azure · TransactSQL (T-SQL)
- Anpassen des Workloades der Data Factory
- Berechnen der neuer Kennzahlen des Krankheitsberichts mit T-SQL
- Erstellen eines Krankheitsbericht in PowerBI
Kenntnisse: Serverless Computing · Azure Data Factory · Azure DevOps · Microsoft Power BI · SQL Azure · TransactSQL (T-SQL)