Seit zehn Jahren beginnt sich die BI-Welt schneller und schneller zu drehen. Es geht nicht mehr nur um Reporting von Kennzahlen aus wenigen Enterprise-Systemen für das Management. Trends und Vorhersagen aus allen Bereichen des Unternehmens sollen in neuen Darstellungsformen wie Apps, Dashboards oder Bots in kürzer werdenden Intervallen einer wachsenden Nutzerschaft bereitgestellt werden.
Bei ERP und anderen LOB-Systemen, die aus dem Hause SAP stammen, hat sich HANA als neue, zentrale Datentechnologie in Position gebracht oben genannte Probleme zu adressieren. Auch die Cloud als Datenspeicher und Verarbeitungsplattform findet immer mehr Verbreitung. In unserem Vortrag demonstrieren wir, wie HANA effizient per Smart Data Integration (SDI) und dem damit verbundenen Adapter Framework mit Cloud-Datenbanken und Daten-Pipelines verbunden werden kann. Hierbei gehen wir auf die Anbindung skalierbarer Cloud-Datenbanken an einem Beispiel mit BigQuery ein und zeigen, wie CloudDataflow kostengünstige und flexible Transformations- und Load-Prozesse ermöglicht. Das Beispiel verdeutlicht weiter, dass auch Open-Source-Technologien wie Hadoop, Spark oder Parquet weiterhin ihren Platz in der Cloud-Welt haben.
Vorkenntnisse
* Grundkenntnisse zu SAP HANA
* Grundkenntnisse zu Cloud DataServices wie BigQuery, Redshift oder Athena
Lernziele
* Moderne Wege zur Integration von HANA und Cloud-Datendiensten
* Spezifika und Fähigkeiten von analytischen Cloud-Datenbanken und Transformationsdiensten.
* SAP-Smart-Data-Integration und das Adapter-Framework als flexibler Einstiegspunkt in die SAP-Welt
* Wie durch Hadoop und Spark Funktionslücken zwischen HANA und Cloud geschlossen werden können
//
Joachim Rosskopf
@jrosskopf
ist Physiker und arbeitet seit nunmehr 16 Jahren als Entwickler, Trainer und Berater für Softwaresysteme im Bereich von Enterprise-Anwendungen und Datenverarbeitung (Big Data oder Data Science).
//
Maren Übelhör
@datamue
arbeitet als Analystin bei Zoi GmbH. Die Mathematikerin ist Expertin für Zeitreihenanalysen und begeistert sich für Data Science und Machine Learning im Big-Data-Umfeld.