Tools und Methoden für
Big, Smart und Fast Data
Karlsruhe, IHK, 29. September - 1. Oktober 2015

data2day 2015 » Programm »

Big Data mit Apache Flink

Apache Flink ist eine Open-Source-Software für die Analyse von Daten im großen Stil. Im Herzen von Flink sitzt eine Streaming-Engine, die Batch- und Stream-Processing gleichermaßen gut unterstützt. Flink-Programme werden mittels APIs in Java, Scala und Python entwickelt. Dabei stehen eine Reihe von Paradigmen wie Map, Reduce und Join zur Verarbeitung von Daten zur Verfügung. Flink unterstützt auch SQL-ähnliche Operationen und verteilte Iterationen. Dieser Vortrag wird Flink anhand von Beispielen aus der Endnutzerperspektive vorstellen.

Skills
Die Zuhörer sollten mit dem MapReduce-Paradigmen vertraut sein und idealerweise auch ein wenig Verständnis vom Hadoop-Ökosystem mitbringen.

Lernziele
In diesem Vortrag werden die Zuhörer mit Flinks grundlegenden API-Funkionen vertraut gemacht. Außerdem sollte der Zuhörer nach dem Vortrag in der Lage sein, Flink von anderen Datenverarbeitungsprogrammen wie MapReduce, Spark, Storm oder Samza zu unterscheiden.

// Referent

// Maximilian Michels Maximilian Michels

ist Committer beim Apache-Flink-Projekt und arbeitet als Softwareentwickler beim Berliner Startup Data Artisans, das sich ganz auf die Entwicklung von Flink konzentriert. Er hat an der Freien Universität Berlin und an der Istanbul Universität studiert. Bevor er bei Data Artisans anfing, war er am Zuse Institute Berlin beschäftigt.