In dem Workshop bereiten wir unsere Umgebungen vor und starten mit einer Einführung in die Grundlagen von Apache Spark. Die wesentlichen Funktionen (der aktuellen Version) werden an interaktiven Beispielen erklärt und können selbst implementiert bzw. erweitert werden.
Danach konzentrieren wir uns auf den Bereich Machine Learning mit einem Überblick der aktuellen Methoden. Einige der Techniken untersuchen wir tiefer und implementieren diese mit Apache Spark beispielhaft.
Die Teilnehmer sollten folgende Software installiert haben:
* Java 8 SDK
* Maven 3.x
* Scala 2.11 + SBT
* VirtualBox 5.x
* Texteditor für umfangreiche Dokumente (z.B. Notepad++ oder Textmate)
* Intellij oder Eclipse in einer aktuellen Version
Der Laptop sollte minimal 6 GByte RAM (besser mehr) installiert haben. HDD min. 15 GByte, besser mehr. Admin-Rechte auf dem Notebook. Wir werden Apache Spark in einer Linux VM betreiben.
Skills
Scala- oder Java-Kenntnisse
Lernziele
Nach dem Training haben die Teilnehmer einen Überblick der aktuellen Methoden im Bereich Machine Learning. Sie können Apache Spark für das Erstellen von Big-Data-Anwendungen in diesem Bereich nutzen.
// Referent
// Heiko Spindler
ist seit über 18 Jahren als Entwickler und Coach in vielen Projekten unterschiedlicher Branchen tätig. Er ist seit 2008 Scrum Master und zertifizierter Software-Architekt. Heiko Spindler ist Dozent an der Technischen Hochschule Mittelhessen (THM), schreibt Artikel und präsentiert auf Fachkonferenzen. Im Jahr 2014 erschien sein Buch "Single-Page-Web-Apps: JavaScript im Einsatz".