Der Chi-Quadrat-Test ist eine Methode aus der mathematischen Statistik und untersucht die Verteilungseigenschaft einer vorgegebenen Datenmenge. Hinsichtlich der Häufigkeit von Ziffern an bestimmten Stellen entsprechen die Annahmen grundsätzlich denen der Gleichverteilung. Sofern 1.000 Datensätze betrachtet werden, kommt jede Ziffer von 0 bis 9 an einer einheitlichen Stelle, beispielsweise der Position vor oder nach dem Komma, statistisch betrachtet 100 Mal vor. Voraussetzung ist auch hier, dass jede Zahl die Chance hat, in gleicher Häufigkeit vorzukommen; es dürfen also auch hier keine Systematiken bestehen, die zu Verzerrungen führen.

Die im Rahmen einer Analyse erfassten tatsächlichen Häufigkeiten werden von der erwarteten Häufigkeit subtrahiert. Die Differenz wird anschließend quadriert, um zu verhindern, dass sich positive und negative Abweichungen aufheben. Abschließend wird die Summe der quadrierten Differenzen durch die erwartete Häufigkeit dividiert; der sich hieraus ergebende Chi-Wert gibt Anhaltspunkte, ob das Zahlenmaterial als zuverlässig angesehen werden kann oder Hinweise auf Abweichungen oder Manipulationen enthält.

Auch dieser Test ist im Repertoire der steuerlichen Betriebsprüfer und kann für interne Verprobungen herangezogen werden.

 
Praxis-Beispiel

Analyse der Fahrtenbuch-Eintragungen mit dem Chi-Quadrat-Test

Die Car Chronicle Control AG möchte die Eintragungen der Betriebsfahrzeug-Fahrer in den digitalen Fahrtenbüchern mithilfe des Chi-Quadrat-Tests verproben. Hierfür werden alle Eintragungen an der letzten Stelle vor dem Komma ausgewertet. Dabei ergab sich für 1.000 Datensätze folgendes Ergebnis:

 
Ziffer erwartete Häufigkeit tatsächl. Häufigkeit Differenz quadrierte Differenz
0 100 84 -16 256
1 100 132 32 1024
2 100 121 21 441
3 100 93 -7 49
4 100 105 5 25
5 100 81 -19 361
6 100 116 16 256
7 100 76 -24 576
8 100 112 12 144
9 100 110 10 100
         
Summen 1.000     3.232
    Chi-Wert (3.232 : 100)   32,32

Je höher der ermittelte Chi-Wert ist, desto größer ist die Wahrscheinlichkeit, dass die ermittelten Differenzen zwischen der tatsächlichen und der erwarteten Häufigkeit nicht auf Zufall, sondern auf Manipulationen beruhen. Bei einem Chi-Wert von 21 bis 30 liegt eine hohe Wahrscheinlichkeit hierfür vor, bei Werten über 30 kann schon fast mit Sicherheit davon ausgegangen werden, dass es bei der Zahlenauswahl nicht mit rechten Dingen zugegangen ist.

Für die Auswertung der Eintragungen der Fahrer der Betriebsfahrzeuge in den digitalen Fahrtenbüchern mit einem Chi-Wert von 32,32 bedeutet dies, dass hier (fast) mit Sicherheit mit manipulierten Datenbeständen gerechnet werden kann und detailliertere Auswertung folgen sollten.

Das ist nur ein Ausschnitt aus dem Produkt Haufe Finance Office Premium. Sie wollen mehr?

Anmelden und Beitrag in meinem Produkt lesen


Meistgelesene beiträge