16.07.2025 aktualisiert


Data Scientist
Skills
Kenntnisse:
- Programmierung: Python, R, Ruby, Apache Spark, Matlab, SQL, Git, HTML, CSS
- Arbeit mit Machine Learning Frameworks z.B. Scikit-Learn, Tensorflow und Keras.
- Auswertung Geodaten z.B. mit h3-Framework von Uber
- Data Science: Einsatz diverser Unsupervised und Supervised Learning Verfahren z.B. Deep Learning, Support Vector Machines, Zeitreihenanalysen, Assoziationsanalysen
- Data Engineering / ETL: Apache Airflow, SSIS
- Business Intelligence: Google BigQuery, MS SQL Server, MySQL, PostgreSQL, Power BI, Looker, Dash
Sprachen
Projekthistorie
Das Unternehmen Urban Mobility International (UMI) ist eine hundertprozentige Tochterfirma von Volkswagen und betreibt den rein elektrischen Car Sharing Service WeShare. Die Firma nahm den Betrieb im Sommer 2019 in Berlin auf und weitet den Dienst nun auf immer mehr Städte in ganz Europa aus. Durch den ausschließlichen Einsatz von Elektrofahrzeugen und die dadurch erhöhten Wartungszeiten entstehen zusätzliche Herausforderungen beim Betrieb der Fahrzeugflotte. Diese spiegelten sich auch in den fachlichen Anforderungen in der Data Abteilung wider.
Als Teil des Data Teams gehörte es zu meinen Aufgaben das Data Warehouse Design zu entwerfen, Datenpipelines zu konstruieren und für die verschiedenen Fachabteilungen im Unternehmen statistische Auswertungen in Form von Dashboards oder Ad Hoc Analysen zu bauen, um diese in ihrer Arbeit zu unterstützen. Dabei habe ich in enger Zusammenarbeit mit den jeweiligen Stakeholdern die fachlichen Anforderungen besprochen und das Datenbankdesign entsprechend zugeschnitten, um effiziente Auswertungen zu gewährleisten.
Neben diesen klassischen Datenauswertungen gehörte zu meinem Aufgabenfeld auch die Entwicklung von Algorithmen für operative Zwecke und die Programmierung von Simulations- und Vorhersagemodellen. So wurden unter Einsatz von Machine Learning
und Optimierungsverfahren Modelle für die Vorhersage von Nachfrage und Ausfallzeiten entwickelt und darauf aufbauend Algorithmen geschrieben, die Wartungsoperationen und die Relokalisierungen der Fahrzeuge von Coldspots zu Hotspots steuern. So sollte eine möglichst hohe Flottenverfügbarkeit und Auslastung erzielt werden.
Eingesetzte Technologien und Qualifikationen: Google Cloud Platform, BigQuery, Google Data Studio, Apache Airflow, Python, Dash, Data Warehousing, Auswertung von Geo Daten, Data Engineering, Data Analysis, Data Science, Machine Learning, Optimierung
Im Rahmen eines Digitalisierungsprojekts beim Kunden, wurde eine Studie durchgeführt, um die bestehende Datennutzung und Vernetzung im Unternehmen zu dokumentieren und Potentiale aufzudecken, wie durch den Einsatz moderner BI und Data Science Methoden Mehrwerte aus den vorhandenen Daten geschaffen werden können. Außerdem sollten Probleme bei der Data Governance identifiziert werden und Maßnahmen zur Verbesserung der Datenqualität vorgeschlagen werden.
Ich habe selbst beim Kunden Interviews und Workshops durchgeführt und anschließend die Studie erstellt. In dieser Studie wurden dem Kunden ausführliche Lösungsansätze geliefert, wie er durch eine Cloud-Infrastruktur mit data Warehouse und Data Lake die Data Governance optimieren und die vernetzte Datennutzung über Abteilungen und Unternehmensstandorte hinweg ermöglichen kann. Außerdem wurden Konzepte für den Einsatz von BI Tools und maschinellem Lernen erläutert, durch die sich Problemstellungen lösen lassen, die sich aus den Interview Terminen ergeben hatten.
Eingesetzte Technologien und Qualifikationen: Data Warehousing, Data Science, Beratung
Bei der GWQ werden Versichertendaten von Krankenkassen mit Hilfe statistischer Methoden ausgewertet. Dadurch sollen Vorhersagemodelle entwickelt werden, die bei Versicherten bisher unentdeckte Krankheiten erkennen oder feststellen, ob Personen Risikogruppen angehören, die zukünftig von bestimmten Krankheiten betroffen sein könnten. Das Ziel dabei ist eine bessere medizinische Betreuung der versicherten bei gleichzeitiger Kostenoptimierung für die Krankenkassen.
Ich habe im Rahmen dieses Projekts die GWQ in verschiedenen Projekten unterstützt. Dabei habe ich über Möglichkeiten zum Einsatz von Machine Learning beraten und war selbst an der Umsetzung dieser Projekte beteiligt. Die Daten wurden hier aus einem Data Warehouse bezogen und mit Hilfe von SQL und R für die Anwendung von Data Science Methoden aufbereitet.
Eingesetzte Technologien und Qualifikationen: MS SQL Server, Machine Learning Services, R, Data Engineering, Data Science