Prof. Dr. Robert Rieg, Prof. Dr. Ute Vanini
Business Analytics als Oberbegriff umfasst die Sammlung von fakten- und datenbasierten Modellen, Methoden und Technologien der Nutzung von Big Data zur Unternehmenssteuerung. Es handelt es sich somit um einen interdisziplinären Ansatz, der analytische Kompetenzen aus der Mathematik, der Statistik und der künstlichen Intelligenz (KI) mit technisch-methodischen IT-Kompetenzen sowie Möglichkeiten der Datensammlung, -integration, -modellierung und -visualisierung verbindet, um daraus Handlungsempfehlungen für die Unternehmenssteuerung abzuleiten. Das Ziel ist die Unterstützung datengetriebener Managemententscheidungen.
Der Einsatz von Business Analytics-Verfahren kann in mehreren Entwicklungsstufen erfolgen (s. Abb. 2). So können analytische Methoden zur Bestätigung bereits getroffener Entscheidungen verwendet werden. Die Daten dienen dann lediglich der Dokumentation der Vergangenheit. Erfahrene Nutzer können verschiedene Entscheidungsalternativen auf der Grundlage von Big Data bewerten.
Wesentliche Voraussetzung ist ein konkretes betriebswirtschaftliches Problem, für das ein Lösungsmodell formuliert wird. Die nächste Entwicklungsstufe ist der Einsatz von Business Analytics-Verfahren, um neue Zusammenhänge in den Daten zu identifizieren und so Ansätze zur Optimierung betriebswirtschaftlicher Zielsetzungen abzuleiten, z. B. zur Steigerung der Produktivität oder der Kundenzufriedenheit. Eine konkrete Problemstellung ist hier nicht im Voraus formuliert. Business Analytics und BI lassen sich dabei wie folgt voneinander abgrenzen:
Abb. 2: Einsatzgebiete von Business Intelligence und Business Analytics
Ein bedeutender Teilaspekt von Begriff Business Analytics sind Methoden der KI. Unter KI versteht man Software-Systeme, die ihre Umgebung nach bestimmten vorab definierten Kriterien, analysieren und darauf basierende Maßnahmen identifizieren, um vorgegebene Ziele zu erreichen. In der Unternehmenspraxis wird der Begriff fälschlicherweise oft als Fähigkeit von Maschinen, menschliche kognitive Fähigkeiten zu mimen, verstanden. Diese Definition ist irreführend, da Maschinen keine menschlichen Fähigkeiten und Fertigkeiten nachahmen können.
KI kann verschiedene Fähigkeiten aufweisen, von denen folgende besonders für ein datengetriebenes RC relevant sind:
- Natural Language Processing (NLP) behandelt die Verarbeitung natürlicher Sprache.
- Informationsgewinnung umfasst die Suche nach Dokumenten basierend auf einem zuvor definierten Informationsbedarf.
- Machine Learning (ML) umfasst mathematische Verfahren zur Verallgemeinerung von Beispielen in einer Menge von Trainingsdaten, um Vorhersagen für Objekte außerhalb dieser Menge zu treffen, z. B. die Klassifikation von Emails als Spam. Ein spezifisches Verfahren ist Data Mining zur Identifikation von Mustern in (großen) Datenmengen, z. B. zur Gruppierung von Kundendaten.
- Im Rahmen des Complex Event Processing werden fortlaufende Ereignisse wie z. B. Kreditkartenbuchungen analysiert. Dabei sollen komplexe Muster in Ereignisfolgen erkannt werden, um z. B. Betrugsfälle zu identifizieren.
KI lässt sich zudem nach dem Grad ihrer Selbständigkeit beim Erschließen von Zusammenhängen in Algorithmische Intelligenz, ML und Tiefes Lernen (Deep Learning) kategorisieren. Algorithmische Intelligenz wie z. B. die Monte Carlo-Simulation ermöglicht noch kein Lernen des Programms, da es auf Änderungen der Inputfaktoren nur gemäß dem verwendeten Algorithmus reagiert, ohne diesen anzupassen.
Beim ML werden oft statistische Verfahren wie z. B. Regressions- oder Klassifikationsanalysen genutzt. Allerdings verbessert der Algorithmus aufgrund von aktualisierten Trainingsdaten seine Modell- bzw. Prognosegüte laufend. Beim ML muss der Anwender allerdings noch Hypothesen zu den vermuteten Zusammenhängen zwischen den verschiedenen Variablen formulieren, die dann vom Algorithmus überprüft werden.
Beim Deep Learning z. B. in Form künstlicher neuronaler Netze (KNN) ist der Algorithmus in der Lage, aufgrund der hinterlegten Trainingsdaten je nach verwendeten mathematischen bzw. statistischen Verfahren auch nicht-lineare Zusammenhänge zwischen verschiedenen Variablen zu identifizieren. Allerdings ist die Qualität der Ergebnisse von der Qualität der Testdaten, des Vorhandenseines eines inhaltlichen und nicht nur statistischen Zusammenhangs zwischen den Variablen und der zeitlichen Stabilität des Zusammenhangs abhängig.