Data Science ist in aller Munde, aber wenigen ist klar, was genau dahinter steckt. In diesem Workshop sollen Grundideen und -konzepte von Data Science und in einem konkreten Beispiel typische Arbeitsabläufe und Analysemethoden vorgestellt werden. Zur Verwendung kommen aktuelle Toolboxen für Python, unter anderem pandas, matplotlib und scikit-learn.
Teilnehmer können die Schritte selbst auf ihren Laptops nachvollziehen und werden individuell betreut. Die Teilnehmer kalibrieren eigene Machine-Learning-Modelle, vergleichen diese miteinander und lernen, wie man geeignete Modelle auswählt. Ein besonderer Schwerpunkt wird auf der richtigen Validierung der Modelle sowie der Auswahl geeigneter Metriken zur Performance-Messung liegen.
Teilnehmer des Workshops erhalten einen Überblick und einen Startpunkt, um ihr Interesse weiter zu vertiefen.
Skills
* Grundlegende Python-Kenntnisse sind von Vorteil.
* Technische Voraussetzungen: Anaconda installiert, IPython Notebook getestet.
Lernziele
* Überblick über zentrale Tools des Python-Data-Science-Ökosystems
* Basiskenntnisse in den Tools numpy, scipy, pandas, scikit-learn
* Verständnis der Grundbegriffe des Machine Learning
* erste praktische Erfahrung in der Anwendung von Machine-Learning-Algorithmen anhand eines Beispiels
// Referenten
// Antje Relitz
ist Mathematikerin mit den Schwerpunkten Maschinelles Lernen sowie Datenanalyse. Sie arbeitet als Data Scientist bei idalab, einer Berliner Agentur für Data Science mit Fokus auf Machine Learning, AI und mathematischer Modellierung.
// Daniel Kirsch
arbeitet als Machine "Dompteur" und hat einen Background in Pattern Recognition und Machine Learning. Er ist Mitgründer des Open Knowledge Lab Münster und Gründer des Data Science for Social Good Berlin. Er arbeitet für idalab in Berlin und versteht sich auf verschiedene Programmiersprachen - vorrangig funktionale.