Die Programmiersprache und Statistiksoftware R ist deutlich älter als der Begriff "Big Data" in der öffentlichen Diskussion. R wurde nicht speziell für große Datenmengen konzipiert, wird aber von Datenanalysten mit statistischem Fokus auch für solche Daten gerne und oft eingesetzt. Als große Datensätze will der Referent hierbei nicht unbedingt Big Data im engeren Sinne bezeichnen, sondern auch große Datensätze, die im Grenzbereich der Verarbeitungsfähigkeit eines einzelnen leistungsstarken Rechners liegen.
Der Vortrag gibt einen Überblick über praktische Erfahrungen, R auf großen Daten performanter einzusetzen.
// Referent
// Dr. Markus Lilienthal
ist Diplom-Mathematiker und hat sich in seiner Promotion mit dem Einsatz von Cloud Computing im Unternehmen auseinandergesetzt. Seit 2012 beschäftigt er sich als Datenanalyst bei der Gesellschaft für Konsumforschung (GfK) im Bereich Forschung und Entwicklung mit großen Daten.