Für den Begriff Big Data existiert in der Literatur keine einheitliche Definition. Im Kern besteht ein wesentlicher Unterschied von Big Data zu der bisher üblichen Art der Datennutzung darin, dass nicht nur erheblich größere Datenmengen analysiert werden, sondern diese regelmäßig aus unterschiedlichen Quellen stammen, unterschiedliche Qualität aufweisen und ggf. auch abweichend strukturiert sind. Diese Eigenarten machen eine Analyse der Daten mittels herkömmlicher Datenbanktechnologie unmöglich. Die Merkmale von Big Data werden in der englischsprachigen Literatur in Form der 4, bzw. 5 "Vs"[1] prägnant illustriert:

  • Datenmenge (volume): bezieht sich auf die extrem großen Volumina an Daten, die permanent generiert und für Big Data Analytics kommerziell verwertet werden. Das Volumen bewegt sich nicht im Bereich von Gigabytes, sondern regelmäßig mindestens in millionenfach größerer Dimension, d.h. Petabytes bis hin zu Zettabytes.
  • Geschwindigkeit (velocity): Die Daten werden mit hoher Geschwindigkeit generiert, z.B. über Sensoren, die permanent Messdaten liefern, und in zunehmendem Umfang auch zeitnah oder sogar in Echtzeit ausgewertet. Die unmittelbare Auswertung stellt einen Paradigmenwechsel von der traditionellen Vorgehensweise, wonach Daten zunächst gespeichert und zu einem wesentlich späteren Zeitpunkt ausgewertet werden, dar.
  • Vielfalt (variety): Ein weiteres wesentliches Merkmal betrifft die Vielfalt der verschiedenen Datentypen, die im Gegensatz zu bisher aus unterschiedlichen Quellen (z.B. Sensorendaten aus Produktionslinien, Messdaten aus Wetterstationen und Satelliten, Kurs- und Volumendaten elektronischer Handelsplätze, Textinformationen aus sozialen Netzwerken, etc.) stammen und daher regelmäßig verschiedene Strukturen und/oder Formate aufweisen. Erst mit Big Data ist es möglich und sinnvoll geworden, bisher nicht in einem offensichtlichen Kontext stehende Daten zu kombinieren und mittels spezifischer Auswertungstechniken, bestimmte Verhaltensmuster und Korrelationen zu erkennen. Darüber hinaus erstreckt sich der Umfang verwertbarer Informationen über die Grenze der Daten im informationstechnischen Sinne hinaus und eröffnet auch insoweit neue Möglichkeiten.
  • Präzision (veracity): bezieht sich auf die inhaltliche Vertrauenswürdigkeit und Ordnung der Daten. Im Gegensatz zu früheren Möglichkeiten der Datenanalyse, ist es nunmehr möglich, auch uneinheitlich strukturierte und partiell inakkurate Daten, z.B. Abkürzungen, Tippfehler, Postings mit fehlerhaften Hashtags etc. für die Datenanalyse zu nutzen.
  • Wert (value): Kein technisches, sondern ein wirtschaftliches Merkmal von Big Data Analytics ist der Umstand, dass die erkannten Potenziale zur Optimierung operativer Geschäftsprozesse der Supply Chain, der Verbesserung der strategischen Entscheidungsfindung von Unternehmen und/oder die (ggf. aufbereiteten) Daten selbst einen hohen wirtschaftlichen Mehrwert repräsentieren können.
[1] Vgl. Marr, Data Strategy, How to Profit from a World of Big Data, Analytics and the Internet of Things, 2017, S. 86 f.

Das ist nur ein Ausschnitt aus dem Produkt Haufe Steuer Office Excellence. Sie wollen mehr?

Anmelden und Beitrag in meinem Produkt lesen


Meistgelesene beiträge