Tools und Methoden für
Big, Smart und Secure Data
Karlsruhe, IHK, 5. - 7. Oktober 2016

Data Quality – The True Big Data Challenge

Es gehört fast schon zu den modernen Mythen, dass ca. 80 Prozent der Arbeit eines Data Scientist das Bereinigen und Vorbereiten der Daten sind. In Wahrheit sind es wahrscheinlich eher 90 Prozent, aber es hilft wenig, einen Mythos durch einen anderen zu ersetzen.

Stattdessen wollen wir der Frage nachgehen, warum Datenqualität de facto eines der größten Probleme in quasi allen Big-Data-Projekten ist und wie man es besser machen könnte. Dafür werden wir das Augenmerk auf den Entstehungsprozess hinter den Daten lenken, denn Daten fallen nicht vom Himmel, sondern werden von irgendwem "gemacht".

Skills
Interesse an Data Science und Data Analytics, idealerweise praktische Erfahrungen.

Lernziele
Verständnis der grundlegenden Anforderungen einer Datenanalyse, typische Datenqualitätsprobleme, Lösungsansätze.

// Referent

// Stefan Kühn Stefan Kühn

beschäftigt sich seit vielen Jahren mit Optimierungsmethoden, Machine Learning, Data Science und mathematischer Grundlagenforschung. Heute arbeitet er als Senior Consultant Data Analytics bei codecentric, analysiert dort große Datenmengen und entwickelt und implementiert moderne Algorithmen.


l>