Werden die Ansätze des Data Warehouse und des Data Lake komponiert, entsteht ein Data Lakehouse.[1] Wie ein Data Lake speichert auch ein Data Lakehouse sämtliche Daten in ihrer Rohfassung. Die Speicherebene ist somit ein Data Lake, sodass sich auch das Data Lakehouse durch eine große Flexibilität hinsichtlich der Datenstruktur als auch in der künftigen Datenverwendung auszeichnet. Die Verarbeitungsebene ist so ausgestaltet, dass die Daten über mehrere Systeme (bzw. Tools) direkt aus der Speicherebene abgefragt werden können. D. h., dass die Daten sowohl für Business Intelligence Anwendungen, als auch für Tools in den Bereichen KI und Machine Learning angewendet werden können. Anders als der Vorgang, in welchem Daten aus dem Data Lake in ein Data Warehouse eingespeist werden (was bedingt, dass 2 Systeme nebeneinander betrieben und gewartet werden müssen), stellt die Data Lakehouse Lösung ein einzelnes System dar. Dies wird ermöglicht, indem die Datenstrukturen und Datenverwaltungsfunktionen vom Data Warehouse übernommen und direkt im Data Lake implementiert werden.[2]

[1] Lorica/Armbrust/Xin/Zaharia//Ghodsi, What is a Lakehouse?, Blog-Beitrag abrufbar unter: https://www.databricks.com/blog/2020/01/30/what-is-a-data-lakehouse.html (letzter Abruf: 17.3.2023).
[2] Koch, Können Lakehouses einen Paradigmenwechsel anstossen?, Blog-Beitrag abrufbar unter https:// hub.hslu.ch/informatik/koennen-lakehouses-einen-paradigmenwechsel-anstossen/ (letzter Abruf: 17.3.2023).

Das ist nur ein Ausschnitt aus dem Produkt Haufe Finance Office Premium. Sie wollen mehr?

Anmelden und Beitrag in meinem Produkt lesen


Meistgelesene beiträge