Big Data

Zusammenfassung

 
Begriff

Der Begriff "Big Data" gelangte in etwa um das Jahr 2010 in den deutschen Sprachraum und bezeichnet nach heutigem Verständnis:

  • ein Bündel neu entwickelter Methoden und Technologien,
  • die in hoher Geschwindigkeit die Erfassung, Speicherung und Analyse
  • eines großen und beliebig erweiterbaren Volumens
  • unterschiedlich strukturierter Daten aus
  • vielfältigen Quellen

ermöglicht. Ziel ist die Erzeugung eines wirtschaftlichen Nutzens.

Das Besondere bei Big Data-Analysen sind neben der Geschwindigkeit vor allem neue Ergebnisse aus der Kombination bisher nicht aufeinander bezogener bzw. bislang nicht auswertbarer Daten. D. h. der innovative Nutzen von Big Data liegt nicht unbedingt in der schnelleren Erzeugung von Erkennt-nissen aus bisher bereits genutzten Datenquellen, sondern in der Erzeugung von neuen Erkenntnissen aus der Verwendung neuer Datenquellen oder der erstmaligen Kombination derselben.

1 Big Data als Entscheidungsunterstützung

Für Unternehmen bedeutet Big Data vor allem eine neue Art der Entscheidungsunterstützung. Neu deswegen, weil bisher ungenutzte Datenquellen sowie eine bisher nicht dagewesene Größenordnung und Vielfalt an Daten, herangezogen werden können. Dies kann zu neuen Erkenntnissen über Kunden, Märkte und sogar das eigene Unternehmen führen.

Aus anwendungsorientierter Sicht beschreibt Big Data den Gebrauch von kosteneffizienter innovativer Technik, die dazu dient, betriebswirtschaftliche Problemstellungen zu lösen. Die behandelten Problemstellungen sind dadurch gekennzeichnet, dass sie mithilfe von konventionellen Datenverarbeitungssystemen nicht gelöst werden können, da sie zu hohe Anforderungen an Ressourcen, wie z. B. die Verarbeitungsgeschwindigkeit, stellen.[1]

Diese "Negativdefinition" wird laut Markl[2] oft von Dienstleistungsanbietern sowie Soft- und Hardwareherstellern verwendet. Er schlägt vor, Big Data von einem anderen Blickwinkel zu betrachten. Seiner Ansicht nach ist ein Hauptmerkmal von Big Data, das Vorhandensein von Datenmengen, mit einer derartigen Größe, dass auf ihrer Basis statistisch signifikante Aussagen getroffen werden können. Auf Grundlage dieser Aussagen können dann wiederum fundierte Entscheidungen getroffen werden.

[1] Vgl. Loshin, 2013.
[2] Vgl. Markl, 2014.

2 Die wichtigsten Eigenschaften

2.1 Volume, Velocity und Variety

Ebenso wie bei der konventionellen Datenanalyse steckt auch hinter dem Konzept Big Data die Absicht, Informationen aus Daten zu extrahieren, um daraus neues Wissen zu generieren. Ein weiterer Ansatz den Begriff Big Data zu beschreiben, verwendet folgende 3 Datenmerkmale, um eine Abgrenzung zu herkömmlichen Daten und deren Analyse herzustellen:

  • ein großes Datenvolumen (Volume),
  • eine hohe Entstehungsgeschwindigkeit der Daten (Velocity) und
  • eine große Vielfalt in der Datenbeschaffenheit (Variety) (vgl. Abb. 1).

Diese 3 Eigenschaften finden sich in zahlreichen Beschreibungen von Big Data wieder. Ein näherer Blick auf diese sollte zum besseren Verständnis des Begriffs beitragen:

  • Volume

    Ein wichtiges Charakteristikum von Big Data ist die große Menge der betrachteten Daten. Sie beginnt typischerweise im Terabytebereich und ist nach oben nicht begrenzt. Wie bereits erwähnt, deuten Prognosen darauf hin, dass die weltweite Datenproduktion auch in den nächsten Jahren sehr stark steigen wird. Unternehmen stehen in Zukunft folglich immer mehr Daten zu Analysezwecken zur Verfügung.

  • Velocity

    Die hohen Geschwindigkeiten, mit denen Daten erzeugt und verarbeitet werden, sind ebenso ein Merkmal von Big Data. In Abhängigkeit von ihrer Quelle können Daten mit unterschiedlichen Geschwindigkeiten erzeugt werden. Für Unternehmen ist es wichtig, auch mit sehr hohen Geschwindigkeiten umgehen zu können, um möglichst schnell auf wirtschaftlich relevante Ereignisse reagieren zu können.

  • Variety

    Eine weitere wichtige Eigenschaft von Big Data besteht in der Heterogenität der Datenbeschaffenheit. Da die betrachteten Daten oft aus sehr verschiedenartigen Quellen stammen, wie z. B. sozialen Netzwerken, elektronischen Handelsplätzen oder Sensoren, unterscheiden sie sich insbesondere in Struktur und Format stark voneinander.

Abb. 1: "Volume", "Velocity" und "Variety" als Big Data Merkmale[1]

[1] In Anlehnung an Klein et. al., 2013, S. 319–323.

2.2 Weitere Big-Data Merkmale: Veracity und Value

Neben diesen 3 Charakteristika gibt es noch 2 weitere Big Data-Merkmale, welche jedoch seltener verwendet werden. "Veracity", ein Big Data-Aspekt, der unter anderem von IBM als relevant angesehen wird,[1] beschreibt die Datenqualität, insbesondere in Bezug auf Authentizität, Vollständigkeit und Mehrdeutigkeit. Der Begriff "Value" taucht auch als Eigenschaft in Big Data-Beschreibungen auf. Er nimmt eine wirtschaftliche Perspektive ein und setzt voraus, dass Daten einen Wert generieren müssen, um als Big Data bezeichnet werden zu können.

Der Begriff Big Data beschreibt also nicht nur die Anwendung von spezieller Technik, sondern wird ebenso für Daten verwendet, welche eine oder mehrere der 3 erstgenannten Eigenschaften aufweisen.

[1] Vgl. IBM, 2014.

3 Literatur

Gleich/Grönke/Kirchmann/Leyk (Hrsg.): Controlling und Big Data, 2014

Das ist nur ein Ausschnitt aus dem Produkt Controlling Office. Sie wollen mehr? Dann testen Sie hier live & unverbindlich Controlling Office 30 Minuten lang und lesen Sie den gesamten Inhalt.


Meistgelesene beiträge