05.11.2025 aktualisiert


100 % verfügbar
Data Scientist | Generative AI | Data Engineer | TensorFlow Certified Developer | Python
Münster, Deutschland
Deutschland +2
B.Sc. Wirtschaftsinformatik | B.Sc. BetriebswirtschaftslehreSkills
PythonSQLGenerative AIPrompt Engineering PySparkTensorflow PyTorchLLMLangchainLlamaIndexData ScientistPytestMaschine LearningData EngineeringComputer VisionObject Detection Deep LearningOpenCVKünstliche IntelligenzSparkArtificial IntelligenceGPTJavaAzureFine TuningPEFTOpenAIStable DiffusionMidjourneyRAG
Ich biete
Rollen: Data Science, Generative AI, Data Engineering, Computer Vision
Tätigkeitsschwerpunkte:
- Generative AI (Fine Tuning LLMs, RAG, LangChain, LlamaIndex)
- Data Warehouse Modellierung und Bau der ETL-Strecken
- Bau von Recommendation-, Ranking- und Regressionsmodellen
- Binäre und Multi-Klassen Klassifikation (Video, Bild, Text, Audio)
- Realtime Object Detection und Pose Estimation (Video, Bild)
- Next Best Offer (NBO), Next Best Action (NBA)
Kompetenzen:
- Sehr gute Kenntnisse: Python, PySpark, SQL, TensorFlow, LangChain, PyTest, pandas, NumPy, OpenCV, XGBoost, LlamaIndex, Git
- Gute Kenntnisse: PyTorch, FastApi, dbt, Flask, MLflow, TypeSkript, Angular, React, Java, Spring Boot, Airflow Alternative,
Weitere Tools und Technologien: Azure, AWS, Power BI, Docker, Kubeflow, Flutter, Bash/Shell, DVC, Kubernetes
Ich freue mich auf Ihre Anfrage und stehe gerne für Gespräche zur Verfügung.
Sprachen
DeutschMutterspracheEnglischverhandlungssicher
Projekthistorie
Vision-AI Document Extractor – ML / GenAI
Konzeption und Entwicklung eines Services zur automatisierten Klassifikation und Transformation von E-Mail-Anhängen in ein strukturiertes Zielformat.
Tätigkeiten:
- Architektur und Implementierung eines End-to-End Document-Extraction-Services (Kafka-basierte Consumer-Producer-Architektur)
- Entwicklung und Training eines CNN zur Dokumentklassifikation
- Definition von JSON-Schemas (Pydantic) zur strukturierten Abbildung verschiedener Dokumenttypen
- Integration von Vision-Language Models (Azure OpenAI, Mistral) zur Extraktion und Befüllung der Dokumentfelder
- Aufbau einer Evaluationskomponente
Technologien:
Python, PyTorch, AzureOpenAI, MistralAI, Pydantic, FastAPI, OpenCV, Gradio, Kafka, Docker, Pandas, Numpy, Salesforce, git
Intent Detection – ML / RAG
Entwicklung einer E-Mail-Klassifikationskomponente zur
automatisierten Verarbeitung eingehender Nachrichten sowie zur
Generierung von Antwortvorschlägen auf Basis historischer E-Mail-
Konversationen.
Tätigkeiten:
- Beratung, Design und Implementierung von Machine-Learning-Modellen zur E-Mail-Klassifikation
- Entwicklung einer LangGraph-basierten Pipeline zur automatischen Generierung einer E-Mail-Taxonomie.
- Umsetzung eines Retrieval Augmented Generation (RAG) Systems zur Antwortgenerierung aus realen E-Mail-Konversationen
Technologien:
Python, scikit-learn, LangChain, LangGraph, MLflow, DVC, Optuna, Pydantic, Docker, Pandas, Numpy, Snowflake, git
AI Operator
Entwicklung einer Retrieval Augmented Generation (RAG) Ingestion- und Retrieval-Pipeline sowie einer Evaluationskomponente basierend auf den Frameworks LlamaIndex, LangChain, Phoenix und MLflow.
Tätigkeiten:
Python, LlamaIndex, Phoenix, MLflow, Docker, MongoDB, LangChain, pgvector, Milvus, Ragas, DeepEval, Pandas, Numpy, Llava, Tesseract, git
Entwicklung einer Retrieval Augmented Generation (RAG) Ingestion- und Retrieval-Pipeline sowie einer Evaluationskomponente basierend auf den Frameworks LlamaIndex, LangChain, Phoenix und MLflow.
Tätigkeiten:
- Beratung, Design und Implementierung von RAG Strategien mit Fokus auf Chat-Applikationen
- Erstellung von Evaluierung-Pipelines für die Optimierung der RAG-Hyperparameter
- Erstellung von Verarbeitungsalgorithmen von Dokumenten
- Recherche und Umsetzung von State-of-the-Art Methoden im Bereich von Generative AI insbesondere LLM
Python, LlamaIndex, Phoenix, MLflow, Docker, MongoDB, LangChain, pgvector, Milvus, Ragas, DeepEval, Pandas, Numpy, Llava, Tesseract, git