Das Spiel gegen die KI: Wie man den Algorithmus zum Narren hält

Was für Daten dem Machine-Learning-Algorithmus zugetragen werden, spielt eine große Rolle in Bezug auf die Ergebnisse. Hat man die Skalierung vergessen, kriegt man verzerrte Ergebnisse. Hat man fehlende Werte, kriegt man teilweise gar keine. Aber warum ist das eigentlich so? Wie kann ich die Probleme umgehen?

In dem Vortrag geht es darum, praktisch zu zeigen, wie Daten vernünftig aufbereitet werden, um verzerrte oder auch gar keine Ergebnisse zu vermeiden. Des Weiteren wird ein Vergleich von Ergebnissen gezogen. Wie schneidet ein Algorithmus mit aufbereiteten Daten, im Vergleich zu einem Algorithmus mit Rohdaten ab? Gemessen wird dies anhand von Ergebnissen eines Vorhersagemodells.

Vorkenntnisse

  • Die Teilnehmenden benötigt keine speziellen Vorkenntnisse
  • Vorteilhaft wäre allerdings ein Verständnis für Programmiersprachen (bevorzugt Python), um dem Vortrag folgen zu können

Lernziele

  • Grundlegendes Verständnis darüber, wie ein ML-Algorithmus funktioniert und wo er angewandt werden kann
  • Verstehen, warum die Datenvorbereitung einer der wichtigsten Schritte im Erstellen einer ML-Pipeline ist
  • Wissen, welche Probleme bei der Datenaufbereitung entstehen können und wie man diese löst

Speaker

 

Emil Vinčazović
Emil Vinčazović hat sein Masterstudium der Volkswirtschaftslehre an der Universität Düsseldorf abgeschlossen. Der Schwerpunkt in seinem Studium lag in den Bereichen der Ökonometrie und der Künstlichen Intelligenz. Er befasst sich mit der Datenaufbereitung und der Datenanalyse. Seine bevorzugten Technologien in der Praxis sind Azure Synapse Analytics und das Azure ML Studio.

data2day-Newsletter

Ihr möchtet über die data2day
auf dem Laufenden gehalten werden?

 

Anmelden