Tools und Methoden für
Big, Smart und Fast Data
Karlsruhe, IHK, 29. September - 1. Oktober 2015

data2day 2015 » Programm »

Tour de Force: Textanalysen mit Streams

Naive Bayes, Textklassifikation, Stream Processing? All das müssen keine böhmische Dörfer sein. In diesem Vortrag wird das Machine Learning von Spark gemeinsam mit der Textanalyse-Funktionen von Elasticsearch genutzt, um eine Historie von Tweets zu analysieren. Auf Basis des gelernten Modells soll man in Echtzeit versuchen können vorherzusagen, zu welchem Sportverein ein Twitterer gehört.

In dem Vortrag werden die Konzepte des Machine Learning und Naive Bayes als Beispielalgorithmus vorgestellt. Angereichert wird es mit jeder Menge Codebeispielen zum Selbstausprobieren.

Skills
Grundlegendes Verständnis zu Spark und Elasticsearch.

Lernziele
Abbau von Ängsten bezüglich Machine Learning.

// Referent

// Stefan Siprell Stefan Siprell

beschäftigt sich als Architekt mit Intergationstechnologien, Big Data und Continuous Delivery, in der Freizeit auch gerne mal mit dem Arduino.