Durch die Digitalisierung, das Internet of Things und die Industrie 4.0 fallen immer größere Datenmengen an. Die Auswertung durch Menschen ist schon lange undenkbar geworden, doch wie können Daten sinnvoll genutzt werden, statt im Archiv zu verstauben? Machine Learning beschäftigt sich mit dieser Frage und bietet Möglichkeiten, sich durch den Dschungel zu kämpfen, Muster zu erkennen und Grundlagen für Entscheidungen zu legen.
In unserem Vortrag geben wir einen Überblick und erklären, was Machine Learning ist. Dazu vermitteln wir Grundlagenkenntnisse, einen allgemeinen Projektworkflow und steigen in einzelne Bereiche tiefer ein, sodass Teilnehmer neue Projekte erfolgreich umsetzen können.
Vorkenntnisse
Für den Vortrag sind keine speziellen Vorkenntnisse nötig.
Lernziele
In unserem Vortrag werden wir einen Überblick über das Thema Machine Learning und mögliche Einsatzzwecke geben, Grundlagen vermitteln, einen allgemeinen Projektworkflow skizzieren und erklären. Um die Theorie praktisch aufzubereiten, werden wir die Themen mit Python Jupyter Notebooks und Daten aus einem realen Beispiel live erklären und visualisieren.
Agenda
* Einführung Machine Learning
* Machine Learning Workflow
* Raw Data Collection
* Pre-Processing
* Sampling
* Model Training
* Model Evaluation
* Hyperparameter Optimization
Link zum GitHub Repository: Machine Learning Workflow
//
Fabian Witt
@witt_fabian
hat seinen Master in Data & Knowledge Engineering an der Otto-von-Guericke-Universität Magdeburg gemacht. In dieser Zeit hat er sich speziell mit Themen wie Maschinellem Lernen, Data Mining und Schwarmintelligenz befasst. Bei der Firma Redheads Ltd. ist er als Technical Lead für den Bereich Data Science verantwortlich.
// Jonathan Staufer
hat seinen Master in Wirtschaftsinformatik an der Technischen Hochschule Nürnberg absolviert. Im Rahmen seines Studiums hat er sich unter anderem mit den Themen Machine Learning, Big Data und Internationales Softwareengineering befasst. Bei der Firma Redheads Ltd. ist er als Softwareentwickler und Data Scientist Teil des Data-Science-Teams.