Grundlagen in Machine Learning (genauer Supervised Learning) und relationalen Datenbanken.
• Relevanz des Themas Datenintegration als Voraussetzung für viele Advanced-Analytics-Anwendungen wie Machine Learning verdeutlichen
• Allgegenwärtigkeit des Problems tabellarischer Daten in einheitliche Schemas zu integrieren
• Schema Matching als supervised Learning Problem formulieren
• Erwartbare Performance der Modelle in der realen Anwendung
• Bewusstsein für die Hürden in der Umsetzung in Projekten schaffen
David Hipp ist Data Scientist und Projektleiter bei der HMS Analytical Software GmbH in Heidelberg. Während seiner Promotion in Mathematik forschte er an Werkzeugen, um die Güte von Wellensimulationen zu bestimmen und engagierte sich in der Wissenschaftskommunikation. Heute automatisiert er Datenintegration mit Hilfe von Machine Learning und entwickelt Advanced-Analytics-Plattformen.