Von Chaos zu Erfolg: Datenqualität beherrschen

Dieser Vortrag behandelt die Herausforderungen bei der Arbeit mit unübersichtlichen und komplexen Daten während der Datenverarbeitung. Wir werden die häufigsten Quellen und Arten von Datenqualitäts-Problemen vorstellen.

Anschließend werden wir uns mit den spezifischen Methoden und Techniken befassen, die zur Identifizierung, Analyse und Behebung solcher Probleme eingesetzt werden, wie beispielsweise Data Quarantining, Data Tests und Data Contracts. Ziel ist es, Strategien, Best Practices und Tools für die Sicherstellung von Datenqualität einzuführen.

Vorkenntnisse

Der Vortrag setzt keine besonderen Kenntnisse voraus. Ein grundlegendes Verständnis für Begrifflichkeit aus dem Bereich des Data Engineering ist sicherlich hilfreich.
Daneben ist ein Interesse an den folgenden Thematiken von Vorteil:

  • Datenqualität
  • Datenpipelines (ETL/ELT)

Lernziele

  • Überblick der Dimensionen von Datenqualitäts-Problemen
  • Vermittlung von Strategien/Patterns wie man Datenqualitäts-Problemen begegnen kann
  • Anknüpfungen der Strategien/Patterns an Projekterfahrung

Speaker

 

Sebastian Löfflath
Sebastian Löfflath studierte Informatik am KIT. Er ist seit über 4 Jahren als Cloud Architect bei inovex tätig. Dabei bewegt er sich häufig an der Schnittstelle zwischen Backend, Data Engineering und Infrastruktur. Die Themen Event-driven Architectures und nachhaltige Software begleiten ihn dabei täglich.

Tim Bossenmaier
Tim Bossenmaier arbeitet als Data- und Software-Engineer bei Bytefabrik.AI. Dort entwickelt er eine intelligente IIoT-Datenanalyseplattform für produzierende Unternehmen. Zudem begeistert er sich für die weite Welt der Open-Source-Softwareentwicklung, ist Core-Contributor und Mitglied des Project Management Committees (PMC) von Apache StreamPipes und trägt regelmäßig zu verschiedenen weiteren Projekten bei.

data2day-Newsletter

Ihr möchtet über die data2day
auf dem Laufenden gehalten werden?

 

Anmelden