Interaktive Big-Data-Visualisierung einsetzen und gestalten

In diesem Reporting Design Tipp werden neue Big-Data-Visualisierung zur Darstellung von multidimensionalen bzw. hierarchischen Datenbeständen vorgestellt.

Neue Visualisierungstypen für das Reporting 

ngesichts der rasant steigenden Datenmengen erlauben die vorgestellten traditionellen Diagramme und (grafischen) Tabellen immer weniger, Zusammenhänge und Entwicklungen rasch zu erkennen. Es werden daher kontinuierlich neue Visualisierungstypen und Interaktionstechniken entwickelt, welche helfen sollen, Big Data nutzbar zu machen und adäquate Maßnahmen daraus abzuleiten.

Benutzerzentrierte interaktive Visualisierungen ermöglichen es den Nutzern, direkt mit der Visualisierung zu interagieren. Der Anwender kann einfacher Muster und Ausreißer erkennen (vgl. Knauf/Wolf, Complex cognition: the science of human reasoning, problem-solving, and decision making, in Cogn. Process, Vol. 11, 2010, S. 99-102) gleichzeitig wird seine kognitive Belastung reduziert (Eisl/Falschlunger/Hofer/Jungert, Reporting Design – A systematic literature review, in ACRN Journal of Finance and Risk Perspectives, Vol. 2, No. 2, 2013b, S. 27-47).

Die nachfolgenden Beispiele konzentrieren sich auf neue Big-Data-Visualisierung zur Darstellung von multidimensionalen bzw. hierarchischen Datenbeständen. Ein multi- oder mehrdimensionaler Datenbestand setzt sich hierbei aus mehreren informationstragenden Attributen oder Fakten (z. B. Umsatz, Deckungsbeitrag) und beschreibenden Dimensionen (z. B. Händler, Land) zusammen.

Tipp: Passen Sie verfügbare Standardvorlagen an Ihre Bedürfnisse an und integrieren Sie mehrere Interaktionstechniken.

Für viele neuartige Big-Data-Visualisierungen stehen in MS Excel oder eigenen Web-Bibliotheken (z. B. D3.js) Standardvorlagen zur Verfügung. Auf Grundlage einer empirischen Studie lässt sich jedoch feststellen, dass diese noch ein erhebliches Optimierungspotenzial in Bezug auf ihre Ausgestaltung sowie die Erweiterung des Interaktionskonzepts aufweisen (Hofer/Walchshofer/Eisl/Mayr/Perkhofer, Sankey, Sunburst & Co – interactive Big Data Visualisierungen im Usability Test, in Konferenzband der CARF 2018). Die im Folgenden präsentierten Beispiele enthalten bereits Funktionalitäten, die über die frei verfügbaren Standards teils deutlich hinausgehen. Spezifische Anpassungen der webbasierten Vorlagen erfordern zwar einen gewissen Programmieraufwand, führen aber auch zu wesentlichen Effektivitäts- und Effizienzfortschritten.

Tipp: Einige der im Folgenden beschriebenen interaktiven Visualisierungen stehen auf der Homepage zum Testen zur Verfügung.

Treemap-Visualisierungen

Eine Treemap dient der Präsentation von hierarchischen Strukturen durch den Einsatz von verschachtelten Rechtecken. Dabei lässt sich von der Größe des jeweiligen Rechteckes auf den jeweiligen Anteil an der Gesamtmenge schließen. Charakteristisch für diese Darstellung ist es daher, mittels Größenverhältnissen einen relativen Bezug zwischen den dargestellten Informationen untereinander herzustellen. So soll das rasche Erkennen von relativen Verhältnissen, Größenordnungen und Verbindungen erleichtert werden.

Zusätzlich kann durch den Einsatz von Farben eine Gruppierung logisch zusammengehöriger Rechtecke vorgenommen werden. Durch die Erweiterung um Drilldown-Möglichkeiten (z. B. Klick auf eine Gruppierung oder auf ein einzelnes Rechteck), können ergänzende Detailinformationen dargestellt werden.

Sankey-Diagramme 

Sankey-Diagramme stellen eine effektvolle Alternative zu klassischen Diagrammtypen dar und werden insbesondere zur Darstellung von Material- und Mengenflüssen verwendet. In den vergangenen Jahren wurde diese Darstellungsform bevorzugt in der Wirtschaft zur Beschreibung von Wertschöpfungsketten, aber auch in der Politik zur visuellen Repräsentation von Wählerstromanalysen eingesetzt. (Waniczek/Patloch, Dashboarding neu gedacht: Leistungsstarkes Reporting durch innovative Diagramme, in CFOaktuell, Vol 31, No. 1, 2018, S. 31-35). Das Sankey-Diagramm zeigt relativ rasch und intuitiv Größenverhältnisse und Relationen einzelner Ströme zur Gesamtmenge. Die Visualisierung besteht aus Verbindungen, auch Flüsse genannt, welche einen Knoten (Dimension 1) mit einem Weiteren (Dimension 2) verbinden. Dabei visualisiert die Breite des Stroms den Anteil der Gesamtmenge und bietet zusätzlich die Möglichkeit der Darstellung von Unterkategorien (vgl. Losbichler/Michels-Kim, Eye tracking for better reports, in Strategic Finance, 2017, S. 37-42).

Voraussetzungen für einen optimalen Einsatz sind die Vermeidung von negativen Werten im Datenbestand und die Sicherstellung, dass die Summe der Datenströme immer 100 % ergibt.

Sunburst-Diagramme 

Ein Sunburst bietet einen weiteren neuen Blickwinkel in Richtung der Gesamtbetrachtung des Datensatzes. Das Diagramm ist eine Erweiterung des Torten- bzw. Ringdiagramms durch die Einführung weiterer Kategorieebenen in hierarchischer Abhängigkeit. Diese Zusammenhänge können nach dem Zwiebel-Prinzip durch die Darstellung multipler konzentrischer Kreise nach außen schnell eruiert werden. Im innersten Kreis befindet sich die oberste Ebene der Hierarchie.

Die Abbildung oben veranschaulicht wiederum die Absatzmengen eines Weinhandels. Die mehrdimensionale Hierarchie wird in der Visualisierung folgendermaßen dargestellt: Auf der höchsten Ebene (im innersten Kreis) wird die Gesamtmenge an verkauften Flaschen Wein pro Händler dargestellt. Auf der nächsten Ebene wird diese Menge in die Dimension Rebsorten (z. B. Rotwein, Weißwein) unterteilt, gefolgt von einer Aufteilung in weitere Dimensionen wie Herkunftskontinent und -staat. Von der innersten Ebene ausgehend werden für jeden Dimensionswert farbliche Abstimmungen vorgenommen, zusätzlich wird durch Interaktion die Möglichkeit der Verschiebung der einzelnen Dimensionen geboten.

Durch die Verwendung einer Mouse-Over-Interaktion (Erscheinen einer Quickinfo bei Ansteuerung des Datenfeldes) und der Änderung der Farbtransparenz können Informationen in den Vordergrund gestellt und Details zum Ausdruck gebracht werden. Irrelevante und nicht explizit ausgewählte Informationen rücken dabei durch Ausgrauen in den Hintergrund. Zusätzlich kann durch Anklicken eines Dimensionsfeldes eine Rotation ausgelöst werden, wodurch eben dieses als neue höchste Ebene angenommen wird. Hierarchisch folgende Dimensionen werden darauf folgend wieder ringförmig angeordnet. Will ein Nutzer nun aus dem zuvor genannten Beispiel nicht die Absatzmenge des jeweiligen Weinhändlers primär behandeln, sondern den Fokus auf die jeweiligen Rebsorten legen, kann er durch das Verschieben der Ebenen eine neue Visualisierung (höchste Ebene stellt nun die Rebsorte dar) und somit eine neue hierarchische Abhängigkeit generieren.

Beispiel Sunburst mit neuer hierarchischer Anordnung der Ebenen

Parallel-Coordinates-Visualisierungen

Parallel Coordinates projizieren mehrdimensionale Datenstrukturen auf eine zweidimensionale Darstellungsfläche. Folgende Abbildung zeigt für die Verkäufe unterschiedlicher Weinhändler mehrere Attributwerte (z. B. Absatz, Umsatz, DB, Weinqualität), die mit differenzierter Skalierung je Achse dargestellt sind: 

Parallel-Coordinates-Visualisierung von Weinhandel

Die ausgewählten Attributwerte werden anschließend durch Linien/Polygonzüge miteinander verbunden.

Auf den ersten Blick sehen Parallel Coordinates durch die Abbildung Hunderter Linien (z. B. jede einzelne Bestellung) in einem Diagramm komplex und unübersichtlich aus. Für unerfahrene Nutzer ist das Erkennen von Zusammenhängen in der Visualisierung zu Beginn etwas schwierig, da nur eine direkte Verbindung zwischen der ausgewählten Achse mit den zwei benachbarten Achsen besteht. Daher sind die ausgewählte Achsenanordnung bzw. die nachträgliche Veränderung dieser ausschlaggebend, um Korrelationen zwischen originär nicht direkt verbundenen Achsen erkennen zu können.

Den besonderen Mehrwert liefert dieser Visualisierungstyp aber erst durch den zusätzlichen Einsatz von Interaktionstechniken. Mittels Hervorhebung und Fixierung beliebiger Intervalle auf den Achsen können folgend Trends bzw. Zusammenhänge bereits visuell, ohne statistische Auswertung, identifiziert werden.

Durchgängige Farbkonzepte stellen auch für diesen Visualisierungstyp einen Mehrwert im Hinblick auf Effizienz und Effektivität dar. Anhand der Farbdifferenzierung pro Händler lässt sich mithilfe des Parallel-Coordinates-Diagramms rasch erkennen, dass vor allem die Händler Meinl, Schenki 1 und Schenki 2 die höchsten Handelsspannen erzielen. Nach Hervorhebung dieser 3 Händler und Neuanordnung der Achsen wird zudem ersichtlich, dass diese Händler keine Lieferkosten aufweisen und infolgedessen ein hoher prozentueller Deckungsbeitrag erzielt werden kann.

Schlagworte zum Thema:  Reporting, Visualisierung