Alpha Epsilon | Profil

Dr. Alexander Engelhardt

Eine PDF-Version meines Profils können Sie hier herunterladen.

An English version of my profile is available for download here.

Auf einen Blick

Dr. Alexander Engelhardt ist ein erfahrener Data Scientist mit Expertise in Machine Learning, Deep Learning und maßgeschneiderten Algorithmen. Er kombiniert fundierte mathematische Grundlagen mit klarer Kommunikation komplexer Analysen.
Seine Fähigkeiten umfassen Programmiersprachen (Python, R, SQL), Big Data Plattformen (AWS, Azure, Spark) und Optimierungstechniken. In verschiedenen Branchen wie Energie, Finanzen und Pharma hat er erfolgreiche Projekte ausgeführt, von Datenpipelines bis zu prädiktiven Modellen.
Dr. Engelhardt ist aktiv in der Open-Source-Community und tritt regelmäßig als Sprecher auf Fachkonferenzen auf.

Schwerpunkte	Data Science Machine Learning, Data Engineering, maßgeschneiderte Algorithmen Programmieren Python, R, SQL, Linux/UNIX shell Big Data Amazon AWS, Microsoft Azure, Spark, Databricks Optimierung Laufzeitoptimierung von Programmen und Algorithmen, Automatisierung von komplexen Arbeitsabläufen Kommunikation Schulungen, anwenderfreundliches "Übersetzen" von Methoden und Ergebnissen, technisches sowie angewandtes Schreiben
Branchenerfahrungen	Energie, Pharma, Finanzen, Marktforschung, Start-Ups, Universitäten
Sprachen	fließend Deutsch und Englisch, Japanisch fortgeschritten (B2, JLPT N2)

Projekthistorie (Auszug)

Ein Auszug meiner bisherigen Projekte (vollständige Projekthistorie als PDF verfügbar)

10/2023-03/2025	Data Scientist / Data Engineer, Pharma-Unternehmen, München Skalierung, Optimierung und Modularisierung des bestehenden Prototypcodes zu einer produktionsreifen Geschäftsanwendung Implementierung einer Testsuite zur Erstellung einer stabilen Datenpipeline Algorithmusoptimierung und Erweiterung der Anwendung auf neue Funktionen Verwendete Tools: Python, AWS, pytest, kedro, pandas, scikit-learn, xgboost, pandera, pydantic, git, Jira, Agile
11/2022-03/2023	Data Scientist, Shape Risk Management, E.ON SE, Essen Entwicklung browserbasierter interaktiver Risiko-Reports für Shape und Performance einer PFC für Strompreise Verwendete Tools: Python, streamlit, pandas, Azure DevOps, git, Jira, scikit-learn, Agile
05/2020-10/2022	Data Engineer, Energy Trading, EnBW AG, Karlsruhe Entwicklung einer Datenverarbeitungspipeline die die Wirtschaftlichkeit für Energiekontrakte berechnet Migration eines Datenverarbeitungssystems von Palantir Foundry nach Amazon Web Services Erstellung von Analysen und Reports für Anwender aus dem Handel Verwendete Tools: Palantir Foundry, AWS (Lambda, Glue, S3, SageMaker), Python, pySpark, SQL, Azure DevOps
08/2018-03/2020	Full Stack Data Scientist, Energy Analytics, E.ON SE, München End-to-End Deployment eines Prognosemodells für Stromgeneration auf Microsoft Azure Entwickelte tagesgenaue Prognosemodelle für Energieverbrauch von Privathaushalten Entwickelte Modelle zur Anomalieerkennung von ungewöhnlichem Stromverbrauch Verwendete Tools: Python, xgboost, Spark, SQL, Azure Cloud, Docker, Databricks, git, Jira
12/2014-12/2023	Dozent, Essential Data Science Training GmbH, München Halten und Weiterentwickeln der Kurse "Data Science Methodenkurs", "Praktische Datenanalyse mit R", und "Programmieren mit R" Link zur Homepage
04/2018-07/2018	Big Data Engineering, aifora GmbH, Düsseldorf Implementierte eine Datenverarbeitungs-Pipeline, von gelieferten Daten in einen internen Hive-Speicher, mit Spark in Python und R. Verwendete Tools: AWS, Spark, Hadoop, Python, Hive, Databricks, R
06/2016-07/2016 05/2017-03/2018	Berechnungen von Price Forward Curves für Energiepreise, Bayerngas Energy GmbH Drei Folgeaufträge: Erstellte ein Programm zum automatischen Pricing von Kundenanfragen Entwarf und programmierte einen Algorithmus zur Generierung von Price Forward Curves für Strompreise, von Stunden- bis Monatsgranularität Programmierte eine Shiny-Applikation zur explorativen Einstellung von Parametern für einen Handelsalgorithmus Optimierte die Laufzeit eines R-Programms zum realtime-Pricing von Handelsdaten von 120 Sekunden pro Iteration auf 15 Sekunden Verwendete Tools: R, RStudio, Shiny, VBA
01/2017-06/2017	Mitentwicklung an einem Produktempfehlungssystem, BASF, Ludwigshafen Implementierte einen Algorithmus zur Interpretation von Interaktionen in xgboost-Modellen Benchmarking gegen Warenkorbanalyse / Assoziationsregeln Verwendete Tools: R, xgboost
04/2015-06/2017	Effiziente Parameterschätzung in R, IBE, LMU München Entwarf und programmierte einen laufzeiteffizienten EM-Algorithmus zur Schätzung von Risikoparametern bei Krebspatienten Verwendete Tools: R, R mit C++, Parallel Processing (BatchJobs-Paket), Cluster Computing (Sun Grid Engine)

Community & Open-Source

mlr	Machine Learning in R. (R-Paket) Contributor des R-Pakets mlr. Diverse Erweiterungen und Bugfixes als Pull-Requests auf GitHub
sng	Startup Name Generator Deep Learning-basiertes Python-Paket zum Generieren von Namensvorschlägen für Unternehmen und Software.
GenoGAM	A GAM based framework for analysis of ChIP-Seq data Erstellung eines R-Pakets zum Berechnen parallelisierter statistischer Modelle auf DNA.
Blogging	Zwei Blogs über Statistik und Machine Learning Crashkurs Statistik - Statistik für Nicht-Statistiker All Things Data Science - Der Alpha Epsilon Blog

Vorträge

10/2018	Interpretable Machine Learning, PyConDE 2019, Berlin Wie man Black-Box-Modelle interpretierbar macht Vortrag auf YouTube
10/2019	Adversarial Machine Learning, PyConDE 2019, Berlin Wie man ein Machine Learning-Modell angreift Vortrag auf YouTube
10/2018	Generate Company Names With Neural Networks, PyConDE 2018, Karlsruhe Vorstellung meines Python-Pakets startup-name-generator Vortrag auf YouTube

Veröffentlichungen

Bücher

Crashkurs Statistik. 2020. Verfügbar auf Amazon.

In Magazinen

Künstliche Intelligenz interpretierbar machen. Erschienen in Informatik Aktuell, 11/2019.
Schnelleinstieg in Data Science und Machine Learning. Erschienen im IT Freelancer Magazin, 09/2017.
Eine Einführung ins Machine Learning. Erschienen in VisualStudio1.de, Ausgabe 04/2015.
Im Sog der Daten - Big Data Analytics mit Revolution R. Erschienen in VisualStudio1.de, Ausgabe 03/2015.

Wissenschaftliche Veröffentlichungen

Efficient Maximum Likelihood Estimation for Pedigree Data with the Sum-Product Algorithm.
Engelhardt A, Rieger A, Tresch A, Mansmann U. Human Heredity, 2017
GenoGAM: Genome-Wide Generalized Additive Models for ChIP-Seq Analysis.
Stricker G, Engelhardt A, Schulz D, Schmid M, Tresch A, Gagneur J. Bioinformatics, 2017
Constructing an ROC Curve to Assess a Treatment-Predictive Continuous Biomarker.
Engelhardt A, Shen YM, Mansmann U. Studies in Health Technology and Informatics, 2016
Comparing classification methods for diffuse reflectance spectra to improve tissue specific laser surgery.
Engelhardt A, Kanawade R, Knipfer C, Schmid M, Stelzle F, Adler W. BMC Medical Research Methodology, 2014

Zertifikate / Auszeichnungen

2025	JLPT N2 (Japanischkenntnisse B2)
2023	Microsoft Certified: Azure Developer Associate
2018	Amazon Web Services (AWS) - Certified Solutions Architect - Associate
2018	Professional Scrum Master I - Scrum.org
2017	Cloudera Certified Spark and Hadoop Developer License: 100-019-222
2013	Certificate of Proficiency in English, Grade A, University of Cambridge

Ausbildung

2025	Japanische Sprachschule KCP International, Tokyo
2013-2017	Promotion (Dr. rer. nat) in der Statistik am IBE der Ludwig-Maximilians-Universität München. Dissertation: Efficient estimation algorithms for large and complex data sets
2011-2013	Master-Studium der Statistik an der Ludwig-Maximilians-Universität München
2008-2011	Bachelor-Studium der Statistik an der Ludwig-Maximilians-Universität München
2005-2008	Ausbildung zum Fachinformatiker, Fachrichtung Anwendungsentwicklung

Sonstiges

Ich betreibe den Blog Crashkurs Statistik, in dem ich Konzepte der Statistik verständlich aufbereite.
Sie finden mich auch auf Xing und LinkedIn
Auf meinem Github-Profil sehen Sie meine Arbeit an verschiedenen Softwareprojekten.
Ich bin auch auf StackOverflow aktiv.

Dr. Alexander Engelhardt

Newest blog posts