Einführung in Maschinelles Lernen mit Apache Spark

In dem Workshop bereiten wir unsere Umgebungen vor und starten mit einer Einführung in die Grundlagen von Apache Spark. Die wesentlichen Funktionen (der aktuellen Version) werden an interaktiven Beispielen erklärt und können selbst implementiert bzw. erweitert werden.

Danach konzentrieren wir uns auf den Bereich Machine Learning mit einem Überblick der aktuellen Methoden. Einige der Techniken untersuchen wir tiefer und implementieren diese mit Apache Spark beispielhaft.

Die Teilnehmer sollten folgende Software installiert haben:

* Java 8 SDK
* Maven 3.x
* Scala 2.11 + SBT
* VirtualBox 5.x
* Texteditor für umfangreiche Dokumente (z.B. Notepad++ oder Textmate)
* Intellij oder Eclipse in einer aktuellen Version

Der Laptop sollte minimal 6 GByte RAM (besser mehr) installiert haben. HDD min. 15 GByte, besser mehr. Admin-Rechte auf dem Notebook. Wir werden Apache Spark in einer Linux VM betreiben.

Skills
Scala- oder Java-Kenntnisse

Lernziele
Nach dem Training haben die Teilnehmer einen Überblick der aktuellen Methoden im Bereich Machine Learning. Sie können Apache Spark für das Erstellen von Big-Data-Anwendungen in diesem Bereich nutzen.

// Referent

// Heiko Spindler

ist seit über 18 Jahren als Entwickler und Coach in vielen Projekten unterschiedlicher Branchen tätig. Er ist seit 2008 Scrum Master und zertifizierter Software-Architekt. Heiko Spindler ist Dozent an der Technischen Hochschule Mittelhessen (THM), schreibt Artikel und präsentiert auf Fachkonferenzen. Im Jahr 2014 erschien sein Buch "Single-Page-Web-Apps: JavaScript im Einsatz".

News
- Wir wünschen unseren rund 240 Teilnehmern eine gute Anreise!03.10.2016
- Jetzt steht unser Gold-Sponsor fest: inovex! Herzlich Willkommen.30.08.2016
+ / -
- Mit etwas mehr als 220 Teilnehmern ist die data2day nun frühzeitig ausverkauft.29.08.2016
- Wir richten am 6. Oktober mit codecentric das data2day Meetup aus.24.08.2016
- Wir haben bereits heute die Teilnehmerzahl des Vorjahres erreicht!16.08.2016
- Das Programm der data2day steht nun online. Damit verbunden kann man sich ab sofort für die Konferenz registrieren.05.07.2016
- Die Verlängerung des CfP hat gefruchtet. Knapp 80 Einreichungen versprechen eine spannende Auswahl.17.05.2016
- Es gab zu viele Bitten, den CfP zu verlängern. Deswegen ist der neue Termin dafür der 16. Mai, also in genau einer Woche.09.05.2016
- Noch bis nächsten Montag können Sie Vorschläge und Workshops vorschlagen.02.05.2016
- Wer sich sein Ticket für die data2day im Oktober schon sichern möchte, kann dies jetzt online tun.29.04.2016
- Ab sofort kann man sich für die nächste Ausgabe der data2day mit einem Vortrag oder Workshop bewerben.16.02.2016
- Einen sehr wohlwollenden Rückblick auf die data2day 2015 vermittelt der Konferenzbericht von Stefan Kühn.15.10.2015
- Die neue Landing Page der data2day 2016 ist online. Jetzt schon mal das Datum notieren. Der Call for Papers startet im März 2016.14.10.2015
Gold-Sponsor
Silber-Sponsoren
Bronze-Sponsoren
Veranstalter
Unser Konferenz-Portfolio

Einführung in Maschinelles Lernen mit Apache Spark

// Referent

// Heiko Spindler

Kontakt

Unser Konferenz-Portfolio

Impressum

Bilder von der Konferenz