Moderne Datenaufbereitung – schnell und einfach von den Rohdaten zur Analyse
Bei der Analyse eines neuen Datensatzes sind die ersten Schritte immer ähnlich. Zu Beginn machen sich Analysten mit den Daten vertraut und prüfen, welche Felder und Datentypen es gibt. Anschließend prüfen sie die Qualität der Daten. Die Wahrheit ist: Daten haben immer Mängel, die adressiert werden müssen.
Ein typischer Ansatz ist es, die Daten mit Pandas zu prüfen und aufzubereiten. All das ist aufwändig, kostet viel Zeit und hält die Analysten von den cooleren Sachen ab.
In seinem Vortrag präsentiert Arne alle notwendigen Schritte an einem Beispiel. Dabei wird er zeigen, wie sich die Aufgaben mit modernen Werkzeugen vereinfachen und beschleunigen lassen, um schneller zum spannenden Teil zu kommen.
Vorkenntnisse
Es ist hilfreich, jedoch nicht essenziell, bereits Datenanalysen mit beispielsweise Pandas durchgeführt zu haben und die typischen Schritte vor Beginn einer Analyse zu kennen.
Lernziele
Der Vortrag zeigt auf, wie sich die ersten Schritte einer Datenanalyse mit modernen Werkzeugen schnell und einfach umsetzen lassen.