Große Datenmengen und massiver Anstieg der Rechenleistung ermöglichen die Optimierung vieler Prozesse durch Methoden des maschinellen Lernens (ML). Während theoretische Aspekte öffentlich diskutiert werden, ist wenig über die Herausforderungen von ML-Systemen im Produktiveinsatz bekannt.
In diesem Vortrag präsentieren wir unsere Erfahrungen und Best Practices der letzten Jahre beim Einsatz unseres ML-Systems zur Betrugserkennung. Wir beleuchten die Evolution unseres Technologie-Stacks hinsichtlich besserer Skalierbarkeit durch den Einsatz von Apache Spark. Des Weiteren stellen wir unser ML-Framework vor, welches Themen wie Modelltraining, Tooling, Model-Management und Deployment umfasst.
Vorkenntnisse
Keine besonderen Kenntnisse notwendig.
Lernziele
Die Teilnehmer sollen einen Einblick in die Herausforderungen beim Einsatz von Machine-Learning-Systemen im Produktionssystem erhalten. Speziell zeigt der Vortrag auf, welche wesentliche Rolle die richtige Technologieauswahl (z.B. typisierte Sprachen, Skalierbarkeit) spielt und welche Tooling-Landschaft der Produktiveinsatz von ML mit sich bringt.
// Patrick Baier
arbeitet als Machine Learning Engineer im Payments Team von Zalando in Berlin. Schwerpunkt seiner Arbeit ist die Entwicklung statistischer Modelle zur Betrugserkennung. Davor arbeitete er als wissenschaftlicher Mitarbeiter an der Universität Stuttgart an probabilistischen Modellen zur Energieeffizienz in mobilen Systemen, wo er 2015 erfolgreich seine Dissertation abschloss.
// Stanimir Dragiev
entwickelt als Teil von Zalando Payments das Machine-Learning-basierte Betrugserkennungssystem mit. Er schloss sein Informatikstudium an der TU Berlin mit einer Diplomarbeit über Resource Management in verteilten Systemen 2009 ab und promovierte 2014 im Machine Learning and Robotics Lab der Universität Stuttgart über Gegenstandsrepräsentationen zum Greifen mit Unsicherheiten.