KI-Anwendung in HR: Interview mit Th. Belker von Precire

Precire Technologies versteht sich als Pionier der KI-Anwendung in HR, doch der Einsatz ihres Sprachanalyse-Tools in der Eignungsdiagnostik ist umstritten. Im Interview mit dem Personalmagazin stellt sich der neue CEO Thomas Belker der öffentlichen Debatte. Wohin führt er die Firma?

Personalmagazin: Sie haben Ihr Amt als CEO von Precire Technologies im Mai angetreten: In den ersten Monaten bekam Precire heftig Gegenwind: Das Diagnostik- und Testkuratorium des Berufsverbandes der Deutschen Psychologen hat ihr Produkt Jobfit schlecht bewertet, ihre Firma bekam den "Big Brother Award", wurde Teil einer kleinen Anfrage der Partei "Die Linke" im Bundestag und es wurden einige kritische Artikel publiziert. Schwerer kann ein Anfang eigentlich nicht sein. Macht Ihnen der Job noch Spaß?

Thomas Belker: Ja. Ich bin nach wie vor von der Aufgabe begeistert, Precire Technologies in die Zukunft zu führen und neu auszurichten. Precire Technologies ist als mittelständisches deutsches Unternehmen absoluter Vorreiter im Bereich KI-Anwendungen. Es ist uns gelungen, die Schnittstelle von wissenschaftlichem Know-how im Bereich Psychologie und Sprache zu den neuesten technologischen Möglichkeiten unserer Zeit herzustellen. Daraus ergibt sich ein enormes Potenzial, das kommunikative Miteinander in Unternehmen zu verbessern. Als Team stellen wir uns der Debatte. Dazu gehört für uns auch, dass wir unsere Arbeit für die Kunden und die Öffentlichkeit transparenter und verständlicher machen.

Personalmagazin: Ihre Firma mit Sitz in Aachen ist seit sechs Jahren am Markt und beschäftigt ungefähr 25 Mitarbeiter. Was war das Ziel der Firmengründung?

Belker: Die Idee zu Precire entstammt aus der Arbeit der Gründer in der Sportpsychologie. Sie haben untersucht, wie die Leistung von Sportlern durch eine motivierende Ansprache verbessert werden kann. Denken Sie etwa an die Ansprache des Fußballtrainers in der Halbzeitpause, mit der er nochmal das absolut Beste aus seinem Team herausholen kann. Aus diesen Beobachtungen ist dann das Vorhaben entstanden, die Muster der Sprache zu untersuchen und diese in Beziehung zu Persönlichkeitsmerkmalen zu setzen. Dabei haben sie festgestellt, dass sie mit den Sprachanalysen zu ähnlichen Ergebnissen kommen wie die etablierte Eignungsdiagnostik. Unser technologisches Verfahren ist aber moderner und einfacher.

Künstliche Intelligenz soll die interne Kommunikation unterstützen

Personalmagazin: Was ist Ihre Vision für die Firma? Was wollen Sie verändern?

Belker: Die Wirtschaft lebt momentan in einer Umbruchphase. Die Unternehmen arbeiten an einer Transformation ihrer Geschäftsmodelle und Unternehmenskultur. Die Rolle der Teams und Mitarbeiter wird gestärkt, die Steuerung über die Hierarchie verliert an Bedeutung. Der Schlüssel zu positiven Veränderungen in den Unternehmen und der Gesellschaft ist ein wirksames kommunikatives Miteinander. Mit unseren Tools können wir hier unterstützen und die Wirkung von Sprache messen. Wir bieten konkrete Lösungen für die Anwender an und leisten damit einen Beitrag zur besseren Kommunikation in Unternehmen.

Click to tweet

Personalmagazin: Der Ethikbeirat HR Tech, dem Sie angehören, hat zehn Richtlinien zum KI-Einsatz in Human Resources publiziert, die im Moment in der Konsultationsphase sind. Richtlinie acht lautet: Achten Sie auf die Subjektqualität. Ich zitiere: "Für die Nutzung von KI-Lösungen dürfen keine Daten erhoben oder verwendet werden, welche der willentlichen Steuerung der Betroffenen grundsätzlich entzogen sind." Ihr Sprachtest, den Sie einsetzen, kann diese Richtlinie nicht erfüllen.

Belker: Im Ethikbeirat HR Tech, dem ich aus Überzeugung angehöre, sind Menschen mit unterschiedlichen Erfahrungen und Überzeugungen versammelt. Dies ermöglicht einen Austausch und eine sachliche Auseinandersetzung, die für mich einen hohen Stellenwert hat. Ich plädiere dafür, dass die angesprochene Richtlinie zur Subjektqualität im Laufe des Konsultationsprozesses angepasst wird. Der entscheidende Punkt bezüglich Subjektqualität ist für mich nicht, ob ich meine Stimme willentlich verändern kann, sondern das Thema Freiwilligkeit. Es darf kein Zwang auf Führungskräfte oder Mitarbeiter ausgeübt werden, sich an einer Sprachanalyse zu beteiligen. Jeder, der teilnimmt, muss verstehen, um was es geht, zu welchem Zweck die Analyse durchgeführt wird und welche Konsequenzen damit verbunden sind. Im Übrigen unterstützen wir unsere Kunden, den Prozess transparent zu machen und die Anwender aufzuklären. Es geht ja immer darum, Potenziale zu erkennen und die passenden Entscheidungen zu treffen.

Personalmagazin: In der Richtlinie vom Ethikbeirat wurde Subjektqualität aber im Sinne der willentlichen Steuerung definiert. In der Erläuterung wird auf den Lügendetektor verwiesen, der vor Gericht nicht eingesetzt werden darf, weil die Subjektqualität nicht gewährleistet wird.

Belker: Die Sprachanalyse hat zunächst einmal gar nichts mit dem Lügendetektor zu tun. Es gibt in der Tat eine Entscheidung des Bundesgerichtshofs von 1954, dass es unrechtmäßig sei, den Lügendetektor in Strafverfahren einzusetzen, wenn unwillentliche Körperreaktionen gemessen werden. Derselbe Bundesgerichtshof hat 1989 entschieden, dass es in erster Linie auf die wirksame Einwilligung ankommt. Der Bundesgerichtshof hat seine Sicht auf den Lügendetektor verändert. Eine Anwendung im Strafverfahren ist aufgrund fehlender Validität nicht zulässig, in der Familiengerichtsbarkeit wird der Lügendetektor dagegen hin und wieder angewendet. Dies ist nur eines von vielen Beispielen, dass Gerichte die Rechtsprechung an die technische Fortentwicklung anpassen.

Individuelle Kommunikationsstile sind trainierbar

Personalmagazin: In Ihrer ehemaligen Position als Personalvorstand haben Sie selbst die Sprachanalyse durchlaufen und darüber berichtet. Sie haben als Rückmeldung bekommen, dass Sie nicht so zukunftsgerichtet und optimistisch wirken, wie sie sich selbst sehen. Daraufhin haben Sie sich vorgenommen, an Ihrer Sprache zu arbeiten. Lässt sich das Ergebnis des Tests also durch Training beeinflussen?

Belker: Das kommt auf die Messebene an. Während die Persönlichkeit stabil bleibt, sind die individuellen Kommunikationsstile durch Training veränderbar.

Personalmagazin: Ist das nicht ein Widerspruch in sich? Ihr Produkt beruht doch auf dem Konstrukt, dass sich in der Sprache eines Menschen, also der Auswertung einer 15-minütigen  Sprachprobe, Persönlichkeitsmerkmale erkennen lassen. Allein durch Veränderung der Sprache werden sich ja die Persönlichkeitsmerkmale nicht verändern.

Belker: Wichtig ist hier die Unterscheidung von Wirkung und Persönlichkeitsmerkmalen. In Ihrem Beispiel entsprach meine Außenwirkung nicht dem Persönlichkeitsbild, welches ich selbst von mir hatte. Wenn ich also ein optimistischer Persönlichkeitstyp bin, aber über meine Sprache eher pessimistischer wahrgenommen werde, ist das eine hilfreiche Rückmeldung. An der Sprache – und damit auch an der Wirkung – kann ich langfristig arbeiten. Persönlichkeitsmerkmale hingegen sind – da ist sich das Gros der Psychologen einig – eher schwer veränderbar.

Click to tweet

Personalmagazin: Den Widerspruch sehe ich nicht aufgelöst. Die Kritik des Testkuratoriums an "Precire Jobfit" lautet, dass die Zuordnung der Persönlichkeitsmerkmale zur Sprachanalyse wissenschaftlich nicht valide ist. Eine wissenschaftliche Evaluation verlangt auch Richtlinie zwei des Ethikbeirats.

Belker: Wir sind von der Validität unserer Studie und unserer Herangehensweise überzeugt. Die Einschätzung des Testkuratoriums sehe ich aus mehreren Gründen kritisch. Zum einen stelle ich mir die Frage, warum das Kuratorium zweieinhalb Jahre braucht, um seine Rezension zu verfassen. Die Anfrage kam im Januar 2017, unsere Antwort einen Monat später. Der erste Entwurf der Rezension erreichte uns am 16. April 2018 und war deutlich positiver formuliert als die heutige. Die untersuchte Version ist mittlerweile völlig überholt.

Personalmagazin: Die lange Dauer ist nicht unüblich. Bemängelt wird die fehlende Validität des Verfahrens, an dem sich ja durch neue Versionen Ihres Produkts nichts geändert hat. Ich zitiere aus der Abschlussbewertung: "Die Überprüfung der Konstruktvalidität an einer neuen Stichprobe ist schlecht dokumentiert, die Angaben zur Kriteriumsvalidität sind ungenügend."

Belker: Die lange Dauer ist auffällig wie auch die negative Veränderung der Formulierung eineinhalb Jahre später. Im Übrigen wird die Validität mit "teilweise" angegeben – von fehlender Validität ist keine Rede.  Selbstverständlich verändert sich die Validität laufend, da wir unsere Testverfahren ständig fortführen.  Unsere Ursprungsstudie war mit 5.200 Probanden bereits überdurchschnittlich groß. Wir haben dazu ein Manual erstellt, auf das sich die Bewertung des Testkuratoriums stützt. Zwischenzeitlich ist das Buch "Psychologische Diagnostik durch Sprachanalyse" von Professor Klaus Stulle erschienen, das unser Verfahren ausführlicher beschreibt als das Manual. Das wird in der Rezension nicht berücksichtigt.

Personalmagazin: Das Verfahren beim Testkuratorium sieht vor, dass das Manual dazu da ist, das Verfahren zu dokumentieren. Andere Quellen können die Tester deshalb nicht heranziehen. Professor Uwe-P. Kanning, einer der führenden Eignungsdiagnostiker, hat sich das Buch von Professor Klaus Stulle genau angeschaut und kommt in seiner Buchbesprechung zu dem  Schluss, ich zitiere: "Man erfährt nicht, welche Features wie, mit welchen Persönlichkeitsmerkmalen zusammenhängen. Das Ganze ist eine Black-Box."

Belker: Unsere Erfahrung lehrt uns etwas anderes. In der Rezension wurde die Beschreibung unseres Verfahrens im Manual für einen spezifischen Anwendungsfall und nicht das Verfahren an sich bewertet. Unsere Kunden sind renommierte Wirtschaftsunternehmen verschiedenster Sparten, deren Fachleute sich das Produkt sehr genau angesehen haben. Wir führen einen offenen Dialog mit unseren Kunden und Wissenschaftspartnern und erläutern die Funktionsweise unserer Anwendung im Detail. Es erfordert die Erklärung von Hintergründen aus zwei verschiedenen Wissenschaftsbereichen – der Informatik und der Psychologie.

Überprüfung der KI als wichtiger Grundsatz

Personalmagazin: Die Richtlinie zwei des Ethikbeirats fordert, dass KI-Anwendungen empirisch evaluiert werden müssen. Wollen Sie künftig enger mit unabhängigen Wissenschaftlern zusammenarbeiten?

Belker: Ein wichtiger Grundsatz unserer Entwicklung ist die laufende empirische Evaluierung unserer KI. Jeder Lernschritt der KI wird mehrstufig überprüft. Wir werden unsere Zusammenarbeit mit der Wissenschaft weiter verstärken. Bestehende Kontakte sind und bleiben unabhängig. Ich stelle mir die Zusammenarbeit allerdings nicht so vor, dass wir Lösungen erarbeiten und die Wissenschaftler ein Art TÜV sind, die unsere Entwicklungen prüfen. Wir wollen mit Wissenschaftlern zusammenarbeiten, die sich mit der Weiterentwicklung unserer Produkte aus­einandersetzen.

Personalmagazin: Mit unabhängiger Evaluation, wie sie dem Ethikbeirat vorschwebt, hat das wenig zu tun. Zahlreiche Wissenschaftler fordern derzeit einen Algorithmen-TÜV für alle KI-Anwendungen im Markt. Sie lehnen das also ab?

Belker: Die meisten KI-Experten sind sich einig, dass ein TÜV für Algorithmen nicht möglich ist und dass das auch der falsche Ansatz wäre. Möglich sind vermutlich Überprüfungsverfahren für KI, bei denen zum Beispiel die Modellierungsprozesse geprüft werden.  Dafür sind wir offen. Das können wir aber nicht alleine als Einzelunternehmen stemmen.

Personalmagazin: Sie haben ja bereits einige Kunden im HR-Bereich. Lassen die sich von der heftigen Kritik nicht abschrecken? Warum bleiben diese Kunden Ihnen treu?

Belker: Unsere Kunden schätzen besonders, dass sie Feedback bezüglich der Wirkung ihrer Sprache bekommen. Wie wirken die Mitarbeiter im Vertrieb auf die Kunden? Wie wirken die Führungskräfte auf die Mitarbeiter? Sie schätzen, dass sie durch unser Tool einen Mehrwert bekommen, um die Wirkung der Sprache zu analysieren und zu verbessern. Ich gebe Ihnen ein aktuelles Beispiel: Ein Unternehmen hat seine Kunden angeschrieben, um diese über neue Produkte zu informieren. Wir haben das Anschreiben mit unseren Tools optimiert, wodurch das Unternehmen 20 Prozent mehr positive Rückmeldungen bekommen hat.

Personalmagazin: Das klingt nach A/B-Testing, das im Direktmarketing seit Langem üblich ist. Bei KI-Anwendungen – so eine weitere Richtlinie des Ethikbeirats – soll sichergestellt sein, dass am Ende der Mensch entscheidet. Doch wenn Ihre Maschine eine Bewertung angibt, drängt sie doch den Entscheider, beispielsweise einen Recruiter, in eine bestimmte Richtung.

Click to tweet

Belker: Ihr Hinweis auf  A/B-Testing ist korrekt. Dies hat deutlich verbesserte Rückmeldungsquoten für das Anschreiben gezeigt, das mithilfe von Precire optimiert wurde. Zu Ihrer Frage: Unser Tool gibt keine Bewertung ab, sondern eine Analyse. Der Recruiter bewertet. Er muss sich ja zunächst überlegen, welche Mitarbeiter er sucht. Seine Aufgabe ist es dann, den Kandidaten als Ganzes zu betrachten, seine Qualifikation, seinen Berufsweg, seine kulturelle Passung, seine Persönlichkeit. Unsere Analyse kann dazu immer nur eine Hilfe geben. Es ist damit eine Komponente im Auswahlverfahren. Mehr nicht, aber auch nicht weniger.

Personalmagazin: Die Unternehmen suchen häufig sogenannte Toptalente, also die Besten eines Jahrgangs. Wollen die sich wirklich einem Testverfahren unterwerfen, das umstritten ist? Ist das nicht eher schädlich für das Personalmarketing?

Belker: Im Recruiting werden Netzwerke immer wichtiger. Die Unternehmen lernen Mitarbeiter über Praktika oder Kollegenkontakte kennen, erleben sie im beruflichen Kontext. Wenn man in Dialog kommt, kann unser Test hilfreich sein, um über die Passung zur Aufgabe und zum Unternehmen ins Gespräch zu kommen. Menschen aus mehreren Perspektiven zu beurteilen, gehört im Übrigen zu jedem guten Auswahlverfahren. Die Bewerber sind damit vertraut. Gerade die Toptalente scheuen auch nicht den Wettbewerb.

Personalmagazin: Precire Jobfit ist als eignungsdiagnostisches Verfahren beim Testkuratorium durchgefallen. Ist das der Grund, warum Sie in diesem Gespräch so stark auf die Wirkung von Sprache abzielen und nicht mehr viel von den Persönlichkeitsmerkmalen gesprochen haben, die mit dem Test stets mitgemessen werden?

Belker: Unser Unternehmen beschäftigt sich mit Sprachanalyse in allen Dimensionen. Wir sind von unserem Potenzial, das kommunikative Miteinander zu verbessern, überzeugt. Dabei ­können wir sowohl Persönlichkeitsmerkmale analysieren als auch die Wirkung der Sprache. Unsere Erfindung ist mittlerweile sowohl in der EU und der Schweiz als auch in den USA patentiert.
 

Das Interview ist in ungekürzter Fassung im Personalmagazin 11/2019 erschienen. Lesen Sie die gesamte Ausgabe auch in der Personalmagazin-App

Hinweis: In derselben Ausgabe des Personalmagazins erschien auch der Artikel "Wovon man nicht reden kann, darüber muss man schweigen" von Prof. Dr. Martin Kersting zum Einsatz des Sprachanalyse-Tools Precire.

Thomas Belker zählt zu den bekanntesten HR-Managern im Lande. Im Mai 2019 wechselte er aus dem Vorstandsbüro des Thalanx-­Konzerns auf den CEO-Posten von Precire Technologies, die mit 25 Mitarbeitern an KI-Anwendungen für HR-Themen arbeiten. Als CEO beendet er die Wagenburgmentalität der Gründer, sucht den Dialog mit den Kritikern und richtet die Firma neu aus.