Vielen Dank an alle Beteiligten für eine sehr schöne data2day 2024 in Heidelberg! Wir sehen uns im nächsten Jahr wieder – am 4. und 5. November 2025 in Karlsruhe

Unit-Testing mit Pytest für Data Scientists

Unit-Testing ist in der Softwareentwicklung gängige Praxis, um die Funktionalität des Codes zu sichern. Die erprobten Konzepte halten inzwischen auch bei Data Science in Produktion Einzug, lassen sich jedoch nicht uneingeschränkt auf alle Schritte einer Machine-Learning(ML)-Pipeline übertragen.

Der Vortrag geht basierend auf Beispielen aus dem Projektalltag auf die Besonderheiten von Unit-Tests in ML-Pipelines ein. Dabei werden veränderte Voraussetzungen im Vergleich zur Softwareentwicklung herausgearbeitet, mögliche Herangehensweisen zum Umgang mit diesen aufgezeigt und hilfreiche Funktionalitäten verfügbarer Tools wie Pytest vorgestellt.

Vorkenntnisse

  • Python-Grundkenntnisse zum Verständnis von Code
  • Erste Erfahrungen mit Pytest sind hilfreich
  • Kenntnisse typischer ML-Pipelines sind hilfreich

Lernziele

  • Die Ziele und Grundvoraussetzungen für Unit-Tests in Data-Science-Anwendungen verstehen
  • Hilfreiche Konzepte und verfügbare Tools kennenlernen
  • Die Anwendung dieser Konzepte und Tools anhand ausgewählter realer Beispiele verstehen

Speaker

 

Lena Trautmann
Lena Trautmann kam über die Softwareentwicklung zur Data Science, wo sie nun für die scieneers GmbH an Data-Science- und Data-Engineering-Projekten arbeitet. Aufgrund ihres Hintergrunds interessiert sie sich sehr dafür, wie man auch in der Data Science von den Best Practices der Softwareentwicklung profitieren kann.

data2day-Newsletter

Ihr möchtet über die data2day
auf dem Laufenden gehalten werden?

 

Anmelden