14.10.2025 aktualisiert


40 % verfügbar
Data Scientist, Data Engineer, AI/ML Engineer
Erkelenz, Deutschland M.Sc. Angewandte Mathematik und Informatik
Skills
JavaAPIsKünstliche IntelligenzAirflowAmazon Web ServicesData AnalysisJiraMicrosoft AzureCloud-EngineeringDatenbankenDatenvisualisierungDevopsWeb EntwicklungR (Programmiersprache)PythonMachine LearningMongodbMysqlNatural Language ProcessingNltkOracle FinancialsPower BiTensorflowSQLCloud PlatformApache SparkDeep LearningKerasGitFastapiHerokuPysparkScikit-learnPlotlyMachine Learning OperationsTerraformDockerDatabricks
FÄHIGKEITEN
- Datenanalyse, KI-Entwicklung, Machine Learning, Deep Learning
- Entwicklung von Cloud-Architekturen & Datenpipelines
- Datenvisualisierung, Erstellung von Dashboards
- Webentwicklung, API-Erstellung
- Statistische Analysemethoden
- MLOps, DevOps
- Programmiersprachen: Python, R, Java, C#, SQL, PySpark
- Bibliotheken: TensorFlow, Scikit-learn, MLflow, OpenAI, LangChain, Airflow, FastAPI
- Datenbanken: MySQL, Oracle, MongoDB, Pinecone
- Cloud-Plattformen: Azure, AWS, Databricks, MS Fabric
- Datenvisualisierung: Power BI, Streamlit, Seaborn, Plotly, Dash, R Shiny
- Sonstige Tools: Git, Jira, Docker, Heroku, Terraform, Azure DevOps
Sprachen
DeutschMutterspracheEnglischverhandlungssicherSpanischgut
Projekthistorie
- Entwicklung einer Datenarchitektur für die Migration genomischer Datenbanken von Oracle zu einem Data Lakehouse auf AWS und Databricks
- Enge Unterstützung des .NET-Entwicklungsteams bei der Integration der neuen Datenarchitektur
- Unterstützung des Softwareteams für die reibungslose Migration von Geschäftsabläufen in die neue Datenarchitektur
- Verwendete Tools: AWS, Databricks, C#, .NET, Python, Azure DevOps
- Durchführung von Vorlesungen und Übungen im Rahmen des AWS Restart Programms zur Zertifizierung von IT-Quereinsteigern zum AWS Cloud Practitioner und AWS Solutions Architect
- Aufbau einer Data Science & KI Schulung
- Aufbau einer Data Analytics & Power BI Schulung
- Schulungsinhalte: AWS-Services (S3, EC2, VPC, IAM, CloudTrail, RDS, Redshift, Aurora, DynamoDB, ElastiCache, EBS, EFS, CLI, Systems Manager, Elastic Beanstalk, ECR, ECS, EKS, Fargate, Athena, OpenSearch, QuickSight, Glue, Flink, Kafka, Kinesis, SageMaker, Elastic Load Balancer, EC2 Auto-Scaling, Route 53, API-Gateway, KMS, Cognito, CloudFront, Lambda, SNS, SQS, Gateways, CloudWatch, CloudFormation), Linux, Python und SQL
- Training eines Large Language Modells zur Zusammenfassung von individuellen Textdokumenten und Steuertexten
- Aufteilung eines Textdokuments in Chunks, Erstellung von Embeddings, Abspeicherung in einer Vektor-Datenbank und Nutzung des LLMs mit LangChain
- Entwicklung einer Webapp mit Streamlit, auf welcher Nutzer Textdokumente hochladen und Fragen zum Inhalt des Dokuments formulieren können
- Nutzung des Large Language Modells zur Beantwortung von Fragen zu Textdokumenten
- Verwendete Tools: Python, OpenAI, LangChain, Pinecone, ChromaDB, Streamlit