Verarbeitung von großen Datenmengen mit unterschiedlicher Struktur

Der MapReduce-Ansatz wurde speziell für die Verarbeitung von Big Data entwickelt und wird von vielen Unternehmen verwendet. Er ermöglicht die schnelle Verarbeitung von sehr großen Datenmengen. Erreicht wird dies durch die Zerlegung und Aufteilung der Daten in kleinere Pakete, welche dann parallel von mehreren Computersystemen verarbeitet werden können. Der MapReduce-Ansatz zeigt seine Stärke in der Verarbeitung von großen Datenmengen mit sehr unterschiedlicher Struktur (Variety). Derartige Daten können z. B. auf Social Media-Plattformen gefunden werden, weshalb MapReduce für Analysen in diesem Umfeld gut geeignet ist. Im Vergleich zu RDBMS zeigen sich aber auch die Schwächen des MapReduce-Ansatzes. Die Durchführung von einfachen Abfragen (z. B. "SELECT-Statements") benötigen in einem MapReduce-System deutlich mehr Zeit als in konventionellen RDBMS. Gleiches gilt für die Definition der Abfragen selbst.[1]

[1] Vgl. Ebner et. al., 2014, S. 3748–3757.

Das ist nur ein Ausschnitt aus dem Produkt ProFirma Professional. Sie wollen mehr?

Anmelden und Beitrag in meinem Produkt lesen


Meistgelesene beiträge