Entwickler intelligenter Software / Senior Machine Learning Engineer

Großheirath, Deutschland

Weltweit

M.Sc. Bioinformatik

Großheirath, Deutschland

Weltweit

M.Sc. Bioinformatik

Profilanlagen

Skills

Python Java MLOPS data analytics & machine learning NLP Automatic Speech Recognition (ASR)Time Series Analysis Computer Vision Game Theory Bioinformatics

Von kleineren Datenalysen über maßgeschneiderte machine-learning Mikroservices bis hin zu Software-Komplettpaketen kann ich für verschiedenste Probleme Lösungen anbieten.

Ich würde mich freuen meine Ideen und meine langjährige Erfahrung in der Entwickung intelligenter Software in Ihr nächstes Projekt einzubringen.

Maschinelles Lernen
Natural Language Processing (NLP)
Automatic Speech Recognition (ASR)
Text-To-Speech synthesis (TTS)
Musik-Informationsgewinnung
Zeitreihen-Vorhersage
Bildverarbeitung / Rechnersehen (Computer Vision)
Regression / Klassifikation
Datenanalyse
Visualisierung
Mustererkennung
Anomalieerkennung
Analyse von Zusammenhängen / Abhängigkeiten
Zeitreihen-Analyse
Audio- / Sprachanalyse
Bioinformatik
Analyse biologischer Daten (-Omics, Massenspektrometrie, ...)
Modellierung biologischer Systeme (chemische Reaktionsnetzwerke, ökologische Multi-Skalen-Modelle, individuenbasierte Modellierung, evolutionäre Spieltheorie)
Verarbeitung mikroskopischer Aufnahmen (Segmentierung, Objekt-Detektion und -Tracking, Klassifikation, Anomalieerkennung)
DevOps
Entwicklung von Microservices
CI/CD
Docker
Kafka
Programmiersprachen
Python
Java
R
C / C++
Go
Bash
Matlab
Mathematica
LaTex
Entwicklungsumgebungen
PyCharm
Jupyter Notebook / Lab
IntelliJ
RStudio
Matlab
Eclipse
Bibliotheken und Frameworks
PyTorch / PyTorch - Lightning / PyTorch - Forecasting
Huggingface Transformers
LangChain
LangGraph
TensorFlow / Keras
Kaldi-ASR
CoquiTTS
GLiNER
FlairNLP
Flask
Streamlit
Deeplearning4j
ImageJ
OpenCV
Scipy
Numpy
Pandas
Frameworks
Amazon Web Services
MS-Azure
Docker
Kubernetes
Kafka
Node.js
Photon
Valhalla
GitHub
GitLab
Bitbucket
Versions-Kontrolle
GIT
SVN
Github
Gitlab
Bitbucket
Projekt-Management
OpenProject
Jira
Confluence
Datenbanken
Neo4j
versch. SQL Datenbanken
MariaDB
MongoDB
ArangoDB

Website

Sprachen

DeutschMutterspracheEnglischverhandlungssicherRussischGrundkenntnisse

Projekthistorie

Natürliche Sprachverarbeitung (NLP), Knowledge Graphs, Graph-RAG

Resultate:

Entwicklung eines Programms zur automatisierten Extraktion von Informationen aus Text-Dokumenten (z.B. Websites, PDF-Dokumente, ...), Aggregation der Informationen in einer Graph-Datenbank (Knowledge-Graph) und Abfrage der Informationen mittels eines generativen Sprachmodells (Graph-RAG). Das Programm kann eigenständig durch Abfrage der Wissensdatenbank entscheiden welche Informationen

aus den Dokumenten unbekannt sind und diese der Wissensdatenbank hinzufügen. Dabei können alle Informationen gesammelt werden oder der Nutzer kann die Themenbereiche einschränken.

Methoden:

Extraktion: Named-Entity-Recognition und Extraktion von Relationen zwischen den Entitäten aus den Dokumenten durch wahlweise ein generatives Sprachmodell oder (effizientere) NER-Modelle (wenn die Themenbereiche vorgegeben sind).
Knowledge-Graph-Erstellung: Gesammelte Informationen aus den Dokumenten werden mit der aktuellen Wissensdatenbank verglichen und, wenn noch nicht bekannt, der Datenbank hinzugefügt (entweder als neue Knoten / Kanten oder als Zusatzinformation zu bestehenden Knoten / Kanten). Ist die Information bereits aus anderen Dokumenten bekannt erhöht dies die Zuverlässigkeit der Information.
Graph-RAG: Abfrage von Informationen aus der Datenbank ist durch natürliche Sprache mittels eines generativen Sprachmodells möglich, welches die natürliche Sprache in eine Datenbank-Abfrage überführen kann und aus den gesammelten Informationen eine Antwort generiert.

Computer Vision, Bildgenerierung

Resultate:

Entwicklung eines Programms zur automatisierten Erstellung und Optimierung von Werbebildern. Das Programm erhält Informationen über das zu bewerbende Produkt und den Verkäufer in natürlicher Sprache und generiert dann selbständig Werbetexte und auf den Inhalt zugeschnittene Bilder, welche auch die selbe “call-to-action” als Text enthalten. Das Programm ist in der Lage erfolgreiche Werbekampagnen über verschiedene Indikatoren zu selektieren und daraus neue Kampagnen zu erstellen (künstliche Evolution zur automatisierten und vorurteilsfreien Optimierung einer Population von Werbekampagnen).

Methoden:

Text-Generierung: Large-Language-Model (LLM) um die Nutzereingabe auszuwerten und die Werbetexte sowie detaillierte Bildbeschreibungen für die Werbebilder zu erstellen.
Bild-Generierung: Text-To-Image Modell um Werbebilder aus den LLMBeschreibungen zu erstellen.
Validierung & Optimierung: Methoden, um den Erfolg der Werbekampagnen anhand verschiedener Indikatoren abzuschätzen und erfolgreiche Werbekampagnen zu replizieren.

Natürliche Sprachverarbeitung (NLP), große Sprachmodelle (LLMs), Chat-Bots.

Resultate: Entwicklung eines Llama-3 Chat-Bots, welcher verschiedene Werkzeuge (Kunden-Datenbanken, Web-Suche, Chat, ...) benutzen kann um Nutzerfragen zu beantworten. Der Bot kann komplett auf kundeneigenen Servern gehostet werden, was auch die Verarbeitung sensibler Daten ermöglicht.

Methoden:

Daten-Pipeline: Pytorch-Lightning Modul um Text-Dokumente mittels eines (kleinen) Sprachmodells in einen Vektorraum zu überführen (Jina-V2 Text-Embeddings) und zusammen mit beliebigen (auch verschachtelten) Metadaten in einer Vektordatenbank zu speichern
Chat-Bot: LangGraph-Agent mit Llama-3 LLM um Nutzerfragen zu beantworten. Der Agent hat verschiedene Werkzeuge zur Verfügung um Informationen über die Frage aus den verknüpften Datenbanken und dem Internet zu sammeln oder Rückfragen an den Nutzer zu stellen, wenn die Frage unklar ist. Anhand der gesammelten Informationen erstellt der Agent dann eine Antwort (Retrieval-Augmented Generation, RAG)

Kontaktanfrage

Einloggen & anfragen.

Das Kontaktformular ist nur für eingeloggte Nutzer verfügbar.

Registrieren Anmelden