Dr. Alexander Engelhardt ist ein erfahrener Data Scientist mit Expertise in Machine Learning, Deep Learning und maßgeschneiderten Algorithmen. Er kombiniert fundierte mathematische Grundlagen mit klarer Kommunikation komplexer Analysen.
Seine Fähigkeiten umfassen Programmiersprachen (Python, R, SQL), Big Data Plattformen (AWS, Azure, Spark) und Optimierungstechniken. In verschiedenen Branchen wie Energie, Finanzen und Pharma hat er erfolgreiche Projekte ausgeführt, von Datenpipelines bis zu prädiktiven Modellen.
Dr. Engelhardt ist aktiv in der Open-Source-Community und tritt regelmäßig als Sprecher auf Fachkonferenzen auf.
Schwerpunkte |
|
Branchenerfahrungen | Energie, Pharma, Finanzen, Marktforschung, Start-Ups, Universitäten |
Sprachen | fließend Deutsch und Englisch |
Ein Auszug meiner bisherigen Projekte (vollständige Projekthistorie als PDF verfügbar)
10/2023-10/2024 | Data Scientist / Data Engineer, Pharma-Unternehmen, München
|
11/2022-03/2023 | Data Scientist, Shape Risk Management, E.ON SE, Essen
|
05/2020-10/2022 | Data Engineer, Energy Trading, EnBW AG, Karlsruhe
|
08/2018-03/2020 | Full Stack Data Scientist, Energy Analytics, E.ON SE, München
|
12/2014-heute | Dozent, Essential Data Science Training GmbH, München Halten und Weiterentwickeln der Kurse "Data Science Methodenkurs", "Praktische Datenanalyse mit R", und "Programmieren mit R" Link zur Homepage |
04/2018-07/2018 | Big Data Engineering, aifora GmbH, Düsseldorf Implementierte eine Datenverarbeitungs-Pipeline, von gelieferten Daten in einen internen Hive-Speicher, mit Spark in Python und R. Verwendete Tools: AWS, Spark, Hadoop, Python, Hive, Databricks, R |
06/2016-07/2016 05/2017-03/2018 |
Berechnungen von Price Forward Curves für Energiepreise, Bayerngas Energy GmbH Drei Folgeaufträge:
|
01/2017-06/2017 | Mitentwicklung an einem Produktempfehlungssystem, BASF, Ludwigshafen
|
04/2015-06/2017 | Effiziente Parameterschätzung in R, IBE, LMU München Entwarf und programmierte einen laufzeiteffizienten EM-Algorithmus zur Schätzung von Risikoparametern bei Krebspatienten Verwendete Tools: R, R mit C++, Parallel Processing (BatchJobs-Paket), Cluster Computing (Sun Grid Engine) |
mlr | Machine Learning in R. (R-Paket) Contributor des R-Pakets mlr. Diverse Erweiterungen und Bugfixes als Pull-Requests auf GitHub |
sng | Startup Name Generator Deep Learning-basiertes Python-Paket zum Generieren von Namensvorschlägen für Unternehmen und Software. |
GenoGAM | A GAM based framework for analysis of ChIP-Seq data Erstellung eines R-Pakets zum Berechnen parallelisierter statistischer Modelle auf DNA. |
Blogging | Zwei Blogs über Statistik und Machine Learning Crashkurs Statistik - Statistik für Nicht-Statistiker All Things Data Science - Der Alpha Epsilon Blog |
10/2018 | Interpretable Machine Learning, PyConDE 2019, Berlin
|
10/2019 | Adversarial Machine Learning, PyConDE 2019, Berlin
|
10/2018 | Generate Company Names With Neural Networks, PyConDE 2018, Karlsruhe
|
2023 | Microsoft Certified: Azure Developer Associate |
2018 | Amazon Web Services (AWS) - Certified Solutions Architect - Associate |
2018 | Professional Scrum Master I - Scrum.org |
2017 | 2. Platz, IT-Freelancer des Jahres 2017 |
2017 | Cloudera Certified Spark and Hadoop Developer License: 100-019-222 |
2013 | Certificate of Proficiency in English, Grade A, University of Cambridge |
2013-2017 | Promotion (Dr. rer. nat) in der Statistik am IBE der Ludwig-Maximilians-Universität München. Dissertation: Efficient estimation algorithms for large and complex data sets |
2011-2013 | Master-Studium der Statistik an der Ludwig-Maximilians-Universität München |
2008-2011 | Bachelor-Studium der Statistik an der Ludwig-Maximilians-Universität München |
2005-2008 | Ausbildung zum Fachinformatiker, Fachrichtung Anwendungsentwicklung |