Alpha Epsilon Logo
    Dr. Alexander Engelhardt
 engelhardt@alpha-epsilon.de

Leistungen

Ich bin derzeit hauptsächlich als Freelancer für Projekte mit einer Laufzeit von 3-18 Monaten tätig, übernehme aber auch kleinere Projekte nebenbei, z.B. kurzfristige Analysen, akademische Abschlussarbeiten usw.

Statistische Beratung und Dienstleistungen

Ich biete Ihnen Expertise im Machine Learning, verschiedener Big Data-Technologien, und unterstütze Sie in Datenverarbeitung, -speicherung, und -analyse. Auch in der statistischen Programmierung in R und SPSS, zum Beispiel für automatisierte Datenauswertung, biete ich meine Hilfe an. Außerdem berate ich Sie zu statistischen Fragestellungen, zum Beispiel der Versuchsplanung.

Durch meine langjährige Erfahrung in der Beratung verstehe ich es, hochkomplexe statistische Algorithmen einfach zu vermitteln, und schaffe so die Brücke zwischen Datenanalyst und Anwender.

Ihre Vorteile

  • Auswahl und Implementierung der statistischen Methoden speziell auf Ihr Problem zugeschnitten
  • Verständliche Erklärung aller verwendeten Analysemethoden
  • Persönlicher E-Mail- und Telefonsupport

Beispielhafte Projekte

  • Entwicklung parallelisierter Data Mining Algorithmen um fundiert und zeitnah entscheidungsrelevante Erkenntnisse aus Ihren Geschäftsdaten zu erhalten
  • Zeitreihen- und Risikoanalysen, ökonometrische Verfahren
  • Pharmakologische Studien zur Wirksamkeit von Medikamenten
  • Auswertung von Marktforschungsstudien
  • Mitarbeiter- und Kundenbefragungen, und deren Implementation, Auswertung, und Präsentation
  • Statistische Modelle zur automatisierten Betrugserkennung
  • Churn-Analysen
  • Qualitätskontrollplanung, Stichprobenplanung und Versuchsplanung
  • Monte-Carlo-Simulationen, Risikosimulationen
  • Lebensdaueranalysen
  • Planung oder Auswertung von Umfragen
  • Akademische Abschlussarbeiten
  • Demografische Prognosen

Schulungen

Ich biete Einzeltermine, ganz- und mehrtätige Workshops, oder regelmäßige Termine zu festen Wochenzeiten an. Details finden Sie hier. Schulungen zu den folgenden Themen sind möglich:

  • Theorieschulungen
    • Grundlagen der Statistik
    • Projektbezogene Workshops
  • Softwarekurse
    • Grundlagen und spezielle Themen in R
    • Datenanalyse mit Python
    • Statistik mit SPSS
    • Basiswissen Matlab

Methodenübersicht

Machine Learning

  • Supervised Learning
    • Klassifikations- und Regressionsbäume
    • Random Forests
    • Neuronale Netze
    • Ensemble-Methoden (z.B. Boosting, Bagging)
  • Data Mining / Unsupervised Learning
    • Datenbereinigung und -transformation
    • Hauptkomponentenanalyse (PCA) und Faktorenanalyse
    • Ausreißererkennung
    • Clusteranalyse
    • Assoziationsregeln
    • Textmining

Big Data

  • Hadoop-Ökosystem (Cloudera, Hortonworks)
  • Spark
  • Hive
  • NoSQL-Datenbanken (Cassandra, MongoDB, HBase)

Finanzmathematik

  • CAPM
  • ARMA/GARCH-Modelle
  • Value at Risk (VaR)-Bestimmung

Optimierung

  • Konvexe Optimierung (lineare und quadratische Programme)
  • Entwicklung effizienter Algorithmen
  • Parallelisierung bestehender Algorithmen
  • Optimierung bestehender Algorithmen (bzgl. Laufzeit und/oder Speicherbedarf)

Grafische Darstellung

  • Histogramme, Boxplots, Zeitreihen, etc.
  • (Vektor-)grafiken in ggplot2 (Beispiel)
  • Interaktive Grafiken im Webbrowser mit R und shiny (Beispiel)

Ergebnispräsentation

  • Interpretation aller Ergebnisse
  • Professionell erstellte Tabellen und Grafiken
  • Berichterstellung mit LaTeX (Beispiel) oder Microsoft Word

Regressionsmodelle

  • Lineare Modelle
  • Generalisierte Lineare Modelle zur Vorhersage von
    • Wahrscheinlichkeiten
    • Zähldaten
    • nichtlinearen Effekten
  • Gemischte Modelle
  • Lebensdauermodelle (z.B. Cox-Modell)
  • Quantilregression

Spezielle statistische Methoden

  • Bayes-Statistik
  • MCMC-Samplingverfahren
  • Markovketten und Markovprozesse
  • Variablenselektion / Regularisierung
    • Boosting
    • Lasso-/Ridge-Regression
    • Hauptkomponentenanalyse (PCA)
  • Funktionale Datenanalyse

Statistische Programmierung

  • R
  • Python
  • SPSS
  • Matlab
  • Skripte zur automatischen Auswertung gleichartiger Datensätze

Versuchsplanung / DoE (Design of Experiments)

  • Fallzahlbestimmung
  • Samplingverfahren
  • Fragebogenerstellung