Konferenz für Big Data,
Data Science und Machine Learning
Heidelberg, Print Media Academy, 26.-29. September 2017

Mein Roboter lernt – mit Reinforcement Learning zum Erfolg

Heutzutage spricht jeder über Machine Learning (ML) und Deep Learning (DL). Im Prinzip gelten beide als Wundermittel, um unerwartete Produktionsausfälle zu vermeiden oder unbekannte Muster auf Datenströmen als Anomalien zu erkennen. Meistens werden hierbei mit genügend großen Datenbeständen entsprechende Modelle trainiert und angewendet.

Aber ein neuer Star scheint am Horizont aufzugehen: Reinforcement Learning (RL). Dabei handelt es sich um ein Konzept, bei dem ein Agent aufgrund seiner Aktionen entsprechende Belohnungen (Incentives) erhält und auf dieser Basis sein Verhalten anpasst und lernt. Der Vorteil hierbei ist, dass es sich dabei um ein "selbstlernendes" System handelt und das Lernen während der Ausführung geschieht. Anwendungen findet man in der Robotik, Steuerung oder speziell bei AI in Spielen. Kombiniert man nun beide Ansätze, so kann ein erstes Modell mit DL gelernt und mit RL verfeinert und verbessert werden. Ein aktuelles Beispiel hierzu ist AlphaGo.

Dieser Talk bietet neben einer Einführung in Reinforcement Learning und deren Kombinationsmöglichkeit mit Deep Learning auch Beispiele aus konkreten Projekten. Dabei wird wird neben Assistenzsystemen auch auf Möglichkeiten im Industrie-4.0- und Internet-of-Things-Umfeld eingegangen: Wollten wir nicht schon immer unsere Roboter einfach lernen lassen ...

Vorkenntnisse
* Keine besonderen Kenntnisse erforderlich
* Motivation mitbringen, etwas Neues zu lernen

Lernziele
* Was ist Reinforcement Learning?
* Anwendungsfälle rundum Reinforcement Learning
* Wie funktioniert das grundsätzlich?
* Wo wird es bereits verwendet?
* Welche Frameworks gibt es?

// Marcel Tilly Marcel Tilly

ist Program Manager bei Microsoft Research. Er beschäftigt sich mit Themen rund um Big Data, Deep Learning und AI; im Detail geht es um Sprach- und Bilderkennung und deren Anwendung in Real-World-Szenarien. Wenn dann noch Zeit bleibt, spricht er auf Konferenzen, schreibt Artikel oder programmiert irgendetwas.


l>