28.12.2024 aktualisiert


Premiumkunde
40 % verfügbarData Engineering, Machine Learning, and DevOps
Leipzig, Deutschland
Weltweit
Promotion Informatik (Dr. rer. nat.)Skills
AzureData EngineeringPythonKotlinDatenplattform Machine learningGoogle Cloud PlattformETL-Strecken Big DataSQLInfrastrukturDevOpsStream ProcessingAmazon AWSKIDevOps / MLOps
Kernkompetenzen
Tools
- Design und Aufbau von cloudbasierten Datenplattformen
- Design und Implementation von Datenfluss-Programmen (analytisch & ETL) Batch & Streaming
- Datenmodellierung DWH
- Datenanalyse mit SQL und Python
- Einbettung von KI in Fachprozesse
- Deployment von KI-Modellen (MLOPs)
- Backend-Entwicklung in MicroService-Landschaften
- Technische Leitung kleiner Entwicklungsteams
- Anforderungsanalyse und Beratung nicht-technischer Stakeholder
- Data Engineering: 10 Jahre
- ML Engineering: 3 Jahre
- Backend Engineering: 5 Jahre
Tools
- Sprachen: Java, Python, Kotlin, SQL
- Data Engineering: Data Vault 2.0, Cloud Dataflow, Apache Beam, dbt, Apache Spark/PySpark, PostgreSQL, SQL Server, BigQuery, MongoDB, pandas, Apache Flink
- Clouds: GCP, MS Azure, AWS
- CI/CD: Gitlab Pipelines, GitHub Actions, Liquibase
- Cloud Native & IaC: Terraform, Terragrunt, Kitchen, Inspec, Kubernetes, Docker
Sprachen
DeutschMutterspracheEnglischverhandlungssicherFranzösischGrundkenntnisse
Projekthistorie
- Entwurf & Entwicklung einer Analytics Datenplattform greenfield von der Anforderungsanalyse, über Werkzeug-/Anbieter-Auswahl, Implementierung und Hyper-Care beim go-live
- Technical Lead & Data Enginner
- Tech Stack:
- AWS: S3, Kinesis, IAM Identity Center, diverse weitere AWS Werkzeuge
- Databricks Plattform: pyspark, Spark SQL, Streaming Delta Live Table
- Python, pandas, numpy, pyspark
- Terraform
- CI/CD mit Github Actions
- Entwurf & Entwicklung von Explainable-AI Modulen für KI-Systeme
- Leitung eines kleinen Tech-Teams
- Tech Stack:
- Google Cloud Plattform: Cloud SQL (PostgreSQL), Cloud Run, Pub/Sub
- Python, pandas, xgboost, numpy, tensorflow
- Terraform, Terragrunt
- CI/CD mit Github Actions
- Optimierung & Erweiterung einer Bibliothek für Feature Engineering (FE) basierend auf Apache Spark
- Identifikation & Behebung von Performance-Problemen einzelner FE-Funktionen
- Erweiterung der Lib um Integration mit Feast und MLFlow
- Tech Stack:
- Apache Spark und PySpark
- MS Azure & Databricks Workspace
- Python, Pandas, feast, mlflow