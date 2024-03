GPT4 und ähnliche generative KI kann bereits jetzt erfolgreich für die einige Aufgaben in Controlling und Finance eingesetzt werden. Dazu zählen lt. einer aktuellen Studienübersicht Erklären, Ideengenerierung, Zusammenfassung und einfache Berechnungen. Woran die aktuelle Version von ChatGPT noch oft scheitert, sind komplexere Analysen, das Erstellen und Verarbeiten von GuV und Cashflow, Buchungssätze sowie das Erstellen von komplexeren Diagrammen. In dem Beitrag werden Use Cases für diese Fähigkeiten vorgestellt.

Überblick

Eine Reihe von aktuellen Forschungsprojekten ermittelte, wo die Stärken und Schwächen von generativer KI, speziell ChatGPT 4, im Controlling und Finance Kontext liegen (s. Tabelle 1)(Für Use-Cases im Auditing siehe Eulerich & Woods 2023).



Konkreter Anwendungsfall ChatGPT 4 Performance Quelle

Erklären

Accounting-Praktiken in Bezug auf Code of Conduct beurteilen Ausgezeichnet Cheng et al. 2023

Regulatorische Anforderungen Gut Cheng et al. 2023

Finance Chat Bot für Mitarbeiter Gut Nestlé 2024

Chat with your data Mittel anekdotisch

Ideen generieren

Maßnahmen zur Profitabilitätssteigerung Gut Cheng et al. 2023

Finance Prozesse anpassen, um Bitcoin-Transaktionen zu unterstützen Gut Cheng et al. 2023

Globale Risiken identifizieren Gut Emett et al. 2023

Unterstützung bei der Auswahl von branchenspezifischen Prozessprüfungen für Wirtschaftsprüfer/Due Diligence Gut Eulerich & Wood 2023

Zusammenfassen

Sustainability Reports zusammenfassen Gut Ni et al. 2023 Excel Sensitivitätsanalysen Gut Mahlendorf 2024 Doppel-Buchungen identifizieren Gut Eulerich & Wood 2023

Berechnungen/Analysen

Einfacher Cashflow aus Exceldaten Gut Mahlendorf 2024

Ein Produkt Break-even Gut Mahlendorf 2024

Profitabilitätsanalysen für verschiedene Geschäftsbereiche Schlecht Dell'Acqua et al. 2023

Break-even für Sales Mix (mehrere Produkte) Schlecht Mahlendorf 2024

Cashflow über 5 Jahre aus Exceldaten berechnen und Nettobarwert ermitteln Schlecht Mahlendorf 2024

Jahresabschluss

Erstellen von Gewinn- und Verlustrechnung (GuV) und Bilanz Sehr schlecht Cheng et al. 2023

G&V mit fixen und variablen Kosten in Deckungsbeitragsrechnung überführen Schlecht Mahlendorf 2024

Buchungssätze mit Berechnung Schlecht Cheng et al. 2023

Diagramme erstellen

BCG-Matrix Sehr schlecht Mahlendorf 2024

Wie die Tabelle zeigt, können die Anwendungsbereiche den folgenden KI-Fähigkeiten zugeordnet werden: Erklären, Ideen generieren, Zusammenfassen, Berechnungen/Analysen, Jahresabschluss und Diagramme erstellen.

Erklären

Eine Stärke von GPT4 ist „Erklären“. Wenn es beispielsweise darum geht, Regulierung- und Finance- Konzepte zu erklären, schneidet GPT4 sehr gut ab. GPT4 kann außerdem Regeln auf konkrete Situationen übertragen und beispielsweise Fragen wie „Beschreiben Sie, wie die ergriffenen Maßnahmen zu einer Erhöhung des Betriebsergebnisses nach US-GAAP in der laufenden Periode führen werden.“ beantworten (Cheng et al. 2023). GPT4 ist somit in vielen Finance- und Controlling-Anwendungen die bessere Alternative zu einer Google-Suche.

GPT4 ist ebenfalls ausgezeichnet darin zu erläutern, ob bestimmte Praktiken mit ethischen Richtlinien vereinbar sind. Getestet wurde dies beispielsweise mit dem IMAs Statement of Ethical Professional Practice and the AICPAs Code of Professional Conduct (Cheng et al. 2023). Einsatzmöglichkeiten hierfür bestehen im Bereich Governance und bei internen Schulungen.

Wird aktuellen Large Language Modellen (LLM) Zugriff auf unternehmensinterne Regelwerke, Kennzahlendefinitionen etc. gegeben, können sie als Finance Chat Bot fungieren. Solche Chat Bots können mehr Transparenz für die Controlling Mitarbeiter herstellen und das Suchen nach Kennzahlendefinitionen und Berechnungsregeln abkürzen.

Anbieter wie SAP haben zunehmend „Chat with your data“ Funktionen integriert. Damit lassen sich Datenabfragen beschleunigen. Vorsicht ist jedoch insofern geboten, dass die KI möglicherweise eine andere Abgrenzung wählt, als der Nutzer intuitiv angenommen hat. Es ist deshalb sicherzustellen, dass die richtigen Stichtage verwendet wurden, die richtigen Produkt-Untergruppen ein- bzw. ausgeschlossen wurden etc.

Ideen generieren

Eine große Stärke von GPT4 besteht außerdem darin Ideen zu generieren. In Accounting und Finance Settings wurde GPT4 beispielsweise erfolgreich nach Maßnahmen zur Profitabilitätssteigerung gefragt und wie Prozesse angepasst werden müssen, um Bitcoin-Transaktionen zu unterstützen. Die Firma Uniper hat LLMs eingesetzt, um globale Risiken zu identifizieren (Emett et al. 2023). Auch für eine Due Diligence können generative KIs Anregungen geben, welche Aspekte bei einer Prüfung, in Abhängigkeit von der Branche, besonders beachtet werden sollten.

Zusammenfassen

Aktuelle KIs können Controllingmitarbeiter auch Zeit sparen, indem sie Information zusammenfassen. Getestete Use Cases bestehen beispielsweise in der Zusammenfassung von Nachhaltigkeitsberichten. GPT4 ist aber auch fähig, aus einer großen Excel-Tabelle mit vielen Sensitivitätsanalysen die wichtigsten Treiber zu identifizieren. GPT4 kann außerdem eingesetzt werden, um Transaktionsdaten zu prüfen und ist beispielsweise in der Lage, Zahlungsvorgänge ohne Genehmigung bzw. Doppelbuchungen zu identifizieren.

Berechnungen/Analysen

Bei mathematischen Berechnungen und quantitativen Analysen zeigt sich momentan noch ein sehr durchwachsenes Bild. Die Leistung von GPT4 variiert sehr stark in Abhängigkeit von der Aufgabenstellung. Einfache Rechnungen funktionieren in der Regel problemlos. Gibt man GPT4 beispielsweise eine Excel-Tabelle mit Jahresüberschuss, Abschreibungen und Investitionen ins Anlagevermögen von verschiedenen Business Units und gibt einen Prompt wie „Errechne die Cashflows“, so führt es die Berechnung korrekt aus (siehe Abbildung 1). Es ist auch in der Lage, diese Cashflows gemäß der BCG-Matrix zu interpretieren.

Bild: Prof. Dr. Matthias D. Mahlendorf Abb. 1: Einfache Cash Flow Berechnung

GPT4 besteht Wirtschaftsprüferexamen (Certified Public Accountant, CPA) und ähnliche Zertifizierungsprüfungen wie CMA (Certified Management Accountant) und CIA (Certified Internal Auditor mit 70-85% der Punkte (Eulerich et al. 2023) – was vielen menschlichen Prüflingen nicht gelingt.

Bei komplexeren Aufgabenstellungen hingegen versagt die Berechnung hingegen regelmäßig.

Abbildung 2 zeigt eine Aufgabenstellung in Excel, die GPT4 nicht in der Lage war korrekt zu lösen.

Bild: Prof. Dr. Matthias D. Mahlendorf Abb. 2: Komplexe Cash Flow Berechnung

Insbesondere kann man sich nicht darauf verlassen, dass eine Aufgabe, die bei einem Durchlauf korrekt gelöst wurde, beim nächsten Durchlauf wieder korrekt gelöst wird. Insofern eignet sich GPT4 momentan also nur für triviale Rechenaufgaben und in einem Kontext, in dem das Ergebnis bei Ungenauigkeit keine schwerwiegenden Konsequenzen hervorruft.

Sehr aufschlussreich war ein Experiment mit 758 Beratern der Boston Consulting Group (BCG). Während die Kontrollgruppe ohne KI arbeitet, löste die andere Gruppe die gleichen Aufgaben mit KI. Bei produktentwicklungsbezogenen Aufgaben, die eher in die Ideen-Generierung fallen, schnitt die Gruppe mit KI deutlich besser ab. Sie erreichte 12,2 % mehr abgeschlossene Aufgaben, waren 25,1% schneller und erzielten eine 40% höhere Qualität. Bei der einzigen Aufgabe mit einer Excel-Tabelle mit Finanzdaten, hingegen, aufgeschlüsselt nach Marken, schnitt die Gruppe mit KI schlechter ab: Bei Beratern, die KI einsetzten, war die Wahrscheinlichkeit, korrekte Ergebnisse zu erzielen, um 19 Prozentpunkte geringer (Dell'Acqua et al. 2023). Bei komplexen Controlling Aufgaben unter Zeitdruck verschlechtert die Nutzung von GPT4 also das Ergebnis.

Diagramme

Die Standardversion von GPT4 ist momentan noch nicht besonders gut darin, aus Daten Diagramme zu erstellen. Es werden zwar Bilder generiert, diese sind jedoch häufig sehr fantasievoll und haben wenig mit den zu Grunde liegenden ökonomischen Daten zu tun. Bei der Bildgenerierung werden darüber hinaus manchmal Begriffe falsch geschrieben oder erfunden, was im Kontext von Kennzahlen zu Verwirrung führen kann. Abbildung 3 zeigt links meine Musterlösung und rechts den Lösungsvorschlag von GPT4.

Bild: Prof. Dr. Matthias D. Mahlendorf Abb. 3: Generierung einer BCG Matrix

Möglicherweise besser funktionieren könnte es, GPT4 nach dem Programmiercode für R oder Python zu fragen und dann in diesen Programmen die Abbildung zu erstellen.

Fazit

Abschließend ist festzustellen, dass für fast jede Controlling Abteilung ein oder mehrere mögliche Use-Cases existieren. Diese bestehen allerdings nicht in der komplexen Datenanalyse oder Verarbeitung von Jahresabschlüssen, sondern eher in begleitenden und unterstützenden Aufgaben. Es bleibt spannend abzuwarten, wie die zukünftigen LLMs die Grenze der nützlichen Use-Cases im Controlling verschieben werden.