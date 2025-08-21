Sprachassistenten ge­hören für viele Menschen bereits zum Alltag. Auch für das berufs­bezogene Lernen bieten sie große Chancen. Aufgrund zahl­­reicher Heraus­­forde­rungen steckt die Ent­wicklung aber noch in den Kinderschuhen.

In der Science-Fiction-Serie "Star Trek" reicht es "Computer?" zu sagen und schon bietet eine ruhige Stimme Unterstützung an. Die Crew des Raumschiffs Enterprise kann dem Betriebssystem nicht nur in gesprochener Alltagssprache Befehle erteilen, sondern auch Informationen abrufen und komplexe Probleme im Dialog lösen. Was in der 1960ern noch Zukunftsmusik war, ist heute technisch zum Greifen nah: Siri, Alexa und Google Assistant erklären uns im Auto, wie wir unser Ziel finden oder schalten zu Hause das Licht ein, ohne dass wir einen Finger rühren müssen. Auch in Arbeits- und Lernprozessen gibt es für Sprachassistenten inzwischen eine Reihe von Einsatzmöglichkeiten. Bis zum allwissenden Bordcomputer ist es noch ein weiter Weg, doch bereits jetzt zeichnen sich neue Perspektiven für das Lernen am Arbeitsplatz ab.

Sprachassistenten in der Produktion

Ein Vorreiter für sprachgesteuertes Lernen am Arbeitsplatz ist das Projekt Coala ("Cognitive Assisted agile manufacturing for a Labor force supported by trustworthy Artificial Intelligence", deutsch: "Kognitiv assistierte agile Fertigung für eine Belegschaft, unterstützt durch vertrauenswürdige künstliche Intelligenz"). Ein internationales Team aus Wissenschaft und Industrie, geleitet von der BIBA – Bremer Institut für Produktion und Logistik GmbH an der Universität Bremen, entwickelte in dem EU-Projekt einen sprachbasierten KI-Assistenten, der Arbeitskräfte in der industriellen Produktion beim Lernen und Arbeiten unterstützt. Das System beantwortet Fragen in natürlicher Sprache. So kann es die Beschäftigten bei der Bedienung von Maschinen, beim nächsten Arbeitsschritt oder bei der Behebung von Fehlern direkt während der Arbeit unterstützen. "Der Assistent kann freihändig und ohne Augenkontakt verwendet werden", erklärt Stefan Wellsandt, wissenschaftlicher Mitarbeiter am BIBA und Koordinator des Projekts.

Besonders nützlich ist ein solcher Sprachassistent in Produktionsumgebungen, die viel spezifisches Wissen und deshalb arbeitsintegriertes Lernen erfordern. Denn aufgrund der starken Auslastung der Fachkräfte kann nicht immer jemand vor Ort sein, um dieses Wissen zu vermitteln. Die Unternehmen, in denen die Technologie getestet wurde, kamen unter anderem aus der Textilindustrie, die hochpreisige Materialien verwendet und deshalb Defekte und Fehler vermeiden muss. Die Fachkräfte führen hoch spezialisierte Tätigkeiten aus; beispielsweise bedienen sie komplexe Webmaschinen oder knüpfen bestimmte Knoten. Der Sprachassistent kann auf multimediale Inhalte zugreifen, Videos einblenden oder Selbsttests anbieten. Dabei setzte Coala zunächst auf deterministische Systeme: Das sind Assistenten, die auf eine bestimmte Eingabe immer die gleiche Antwort ausspielen. Sie sind demnach vorhersehbar und ihre Antworten lassen sich rückwirkend auch besser erklären. Das entsprach dem Wunsch nach Zuverlässigkeit und Transparenz, den viele Industriepartner geäußert hatten.

Sprachgesteuertes Lernen auf dem Markt

Das Coala-Projekt endete im Herbst 2023, also kurz nachdem Large Language Models (LLM) wie Chat GPT für eine breite Masse zugänglich wurden. Wie sich dialogfähige Künstliche Intelligenz weiter in der Industrie verbreiten lässt, demonstriert aktuell das Nachfolgeprojekt Wasabi ("White-label shop for digital intelligent assistance and human-AI collaboration in manufacturing", deutsch: White-Label-Plattform/offene Plattform für digitale Assistenzsysteme und die Zusammenarbeit von Mensch und KI in der Produktion). Ein neuer Pilot-Anwendungsfall ist die Produktion medizinischer Masken, was etwa im Krisenfall einer Pandemie relevant wäre, wenn in kurzer Zeit viele Beschäftigte eingearbeitet werden müssen. "Die Idee war, mit dem Sprachassistenten eine Art Vortraining zu ermöglichen, bevor die eigentliche Vor-Ort-Einweisung erfolgt", erklärt Wellsandt. Dabei wurden Lernmaterialien nach didaktischen Prinzipien erstellt und durch Sprachinteraktion zugänglich gemacht.

Ob der Sprachassistent langfristig messbare Lerneffekte bei den Mitarbeitenden bringt, ist laut Wellsandt noch offen. "Dafür bräuchte es aber längere Studien und echte Pilotphasen – mit Unternehmen, die bereit sind, das über Monate hinweg mitzutragen." Erste Experimente seien vielversprechend. Mit der im Dezember 2024 in Bremen gegründeten Coala AI GmbH will ein Teil des Projektteams nun die Erkenntnisse aus Coala und Wasabi marktfähig weiterentwickeln und sucht dafür Industriepartner.

Die Chancen von Sprachassistenten

Auch das Softwareunternehmen Micromate sieht in sprachgesteuertem Lernen ein wichtiges Instrument für die Personalentwicklung. Eines seiner Produkte ist ein KI-gesteuerter Lernassistent, der sich in digitale Lernumgebungen integrieren lässt. Darin beantwortet er den Nutzerinnen und Nutzern Fragen oder fordert sie mit kleinen Quizfragen zum spielerischen Lernen auf. Bisher ist der Assistent rein textbasiert. Allerdings arbeitet das Team von Micromate bereits an neuen Features, darunter Conversational User Interfaces (CUI), also digitale Systeme, über die Menschen mit Computern in gesprochener Sprache kommunizieren. Ein Beispiel dafür ist ein Projekt der Schweizerischen Bundesbahnen (SBB), das es basierend auf der Google-Assistant-Technologie ermöglichte, über Sprachbefehle Informationen zu Fahrplänen, Ticketpreisen, Zugauslastungen und Verspätungen abzurufen.

"Lernende können mit sprach­ge­steuer­ten Tools ihre Konzentration voll­ständig auf den Lerninhalt richten." Christoph Süess, Geschäftsführer des Softwareunternehmens Micromate

Micromate-Geschäftsführer Christoph Süess sieht in der Konversationsfähigkeit zwischen Mensch und Maschine großes Potenzial für die Weiterbildung. Er geht davon aus, dass sprachgesteuerte Lerntools in den nächsten Jahren wie viele andere KI-Anwendungen an Popularität gewinnen und mehr Einsatzmöglichkeiten finden werden: "Gesprochene Sprache ist die für uns Menschen gängigste Form der Kommunikation. Daher liegt es nahe, dass sie auch im E-Learning viele Vorteile bietet." Dabei könnten die Lernenden etwa ihre Konzentration vollständig auf den Lerninhalt statt auf die Bedienung des Computers richten. "Und Lernen ist auch dann möglich, wenn die Hände anderweitig gebraucht werden, etwa beim Autofahren oder bei handwerklichen Tätigkeiten." Durch KI-gestützte Entwicklungen eröffneten sich aktuell neue Möglichkeiten für eine natürlichere Interaktion.

Sprachgesteuerte Tools für niedrigschwelliges Lernen

Georg Winder, Dozent für Medien und Informatik an der Pädagogischen Hochschule St. Gallen und Co-Creator der digitalen Lernplattform aprendo.ch, beobachtet eine klare Entwicklung hin zu dialogisch-interaktiven Lernformen. Seiner Einschätzung nach liegt die Zukunft des Lernens zunehmend in der sprachlichen Interaktion: "Gesprochene Dialoge ermöglichen eine stärkere kognitive Aktivierung und fördern das aktive Verarbeiten von Inhalten – ein Effekt, der auch in der kognitionspsychologischen Forschung vielfach belegt ist." Winder sieht in sprachgesteuertem Lernen die Chance, Lernprozesse zugänglicher und individueller zu gestalten.

Besonders geeignet sei die Technologie für situatives Lernen, zum Beispiel in der betrieblichen Weiterbildung oder im Arbeitsschutz, oder auch für sprachlich-interaktive Settings, etwa beim Sprachenlernen oder beim Training kommunikativer Kompetenzen. Zudem sieht Winder wie Christoph Süess sprachgesteuertes Lernen vor allem in Kontexten, in denen eine manuelle Interaktion nicht möglich oder unpraktisch ist. Das betrifft beispielsweise technisches Feldtraining sowie Tätigkeiten im Handwerk oder der Pflege. "Sprachgesteuertes Lernen eignet sich besonders für Just-in-time-Lernformate im Arbeitskontext, zum Beispiel beim Bedienen von Maschinen oder bei Sicherheitsanweisungen." Damit bestätigt Winder das Ziel, was auch Stefan Wellsandt mit seinen Projekten verfolgt.

"Voice Interfaces werden die Gestaltung von Lernprozessen tiefgreifend ver­ändern." Georg Winder, Dozent an der Päda­go­gischen Hochschule St. Gallen

Winder sieht in sprachgesteuerten Tools vor allem das Potenzial für niedrigschwelliges und kontextsensitives Lernen – ein Aspekt, der didaktisch enormes Entwicklungspotenzial berge. Dabei zeichnen sich seiner Einschätzung nach grundlegende Veränderungen in der Lern- und Arbeitskultur ab: "Schon in naher Zukunft werden wir vermehrt Menschen erleben, die selbstverständlich mit sprachbasierten Schnittstellen kommunizieren – sei es beim Autofahren, beim Spazieren oder im Büro."

Sprachassistenten für inklusive Weiterbildung

Laut Winder kann durch sprachgesteuertes Lernen Weiterbildung auch inklusiver gestaltet werden. Zum Beispiel Menschen mit motorischer Behinderung, Sehbehinderung oder geringen Schriftsprachkenntnissen könnten profitieren. Studien würden zeigen, dass für diese Personen sprachgesteuertes Lernen motivierend und zugänglich wirken und die Selbstwirksamkeit fördern könne. Voraussetzung sei jedoch Barrierefreiheit bei Spracheingabe und -ausgabe, also dass der Sprachassistent zum Beispiel auch Dialekte versteht.

Für blinde Personen und Menschen mit Sehbehinderung können Sprachassistenten ein nützliches Tool sein, vor allem im Alltag und Haushalt. Im Bildungs- und Arbeitskontext kommen sie bisher allerdings kaum zum Einsatz, wie Christian Axnick, Mitarbeiter der Geschäftsstelle beim Deutschen Verein der Blinden und Sehbehinderten in Studium und Beruf (DVBS), berichtet. Trotzdem ist Sprache ein zentraler Kanal der barrierefreien Kommunikation. "Im Arbeitsumfeld und Weiterbildung spielt der Screenreader, oft ergänzt mit einer Braillezeile, die zentrale Rolle", erklärt Axnick. Damit können sehbeeinträchtigte Menschen Inhalte sprachlich erfassen. Vollständige Tastaturbedienbarkeit müsse gegeben sein, um Aufgaben erfüllen zu können, und sei auch das zuverlässigste Werkzeug, wo exakte Kontrolle gefragt ist.

Die entscheidende Voraussetzung für digitale Inklusion sei nicht eine bestimmte Technologie, sondern normgerecht umgesetzte Barrierefreiheit in Websites, PDFs und Lernplattformen. Erst wenn Inhalte korrekt strukturiert sind, könnten Screenreader oder auch KI-Systeme sinnvoll eingesetzt werden. Sprachgesteuerte Lernangebote sieht Axnick daher nicht als vorrangiges Inklusionsinstrument: "Bildung ist immer der Umgang von Menschen mit Menschen. Technik kann unterstützen, aber wenn sie die zentrale Rolle spielt, dann läuft vermutlich etwas falsch." Deshalb plädiert der DVBS vor allem für Barrierefreiheit in Weiterbildungen, was etwa bedeuten kann, dass Dozierende ihr Material nicht nur visuell präsentieren, sondern die Inhalte verbalisieren. Außerdem sollte es eine Selbstverständlichkeit sein, die Bedarfe von Menschen mit Behinderung von Anfang an mitzudenken.

Die Grenzen von sprachgesteuertem Lernen

Sprachgesteuerte Lernsysteme reichen also als Inklusionsinstrument nicht aus – und auch sonst stoßen ihre Einsatzmöglichkeiten derzeit noch auf technische, didaktische und gesellschaftliche Grenzen. Viele Dozierende und Lernende haben Bedenken bezüglich des Datenschutzes, dem Projekte wie Wasabi und Coala bereits mit einer DSGVO-konformen KI begegnen.

Eines der größten Probleme ist aktuell noch die inhaltliche Verlässlichkeit der Systeme, gerade wenn Large Language Models zum Einsatz kommen. "Je eloquenter die KI, desto höher das Risiko, dass sie plausible, aber falsche Antworten liefert", berichtet Wellsandt von den Herausforderungen im Wasabi-Projekt, "die Information sieht so aus, als wäre sie richtig – ist es aber nicht unbedingt." Solche Unschärfen seien in sensiblen Bereichen wie Arbeitssicherheit oder Maschinenbetrieb problematisch. Während deterministische Systeme wie im ursprünglichen Coala-Ansatz zuverlässig, aber wenig flexibel reagierten, bringen dialogfähige KI-Modelle zwar mehr Interaktivität, aber auch ein höheres Risiko für Fehlkommunikation mit sich.

Christoph Süess von Micromate beobachtet zudem gesellschaftliche Hürden: "Das Sprechen mit einem Computer in der Öffentlichkeit wirkt für viele noch ungewohnt – ähnlich wie das laute Telefonieren im Zug früher irritierte." Für ihn bleiben sprachgesteuerte Tools mittelfristig eine ergänzende Lernform mit hohem Potenzial für bestimmte Kontexte, aber begrenzter Alltagstauglichkeit. Micromate selbst plant die Integration von Sprachsteuerung als nächsten Entwicklungsschritt des digitalen Lernassistenten. Süess und sein Team sind sich aber darüber bewusst, dass diese nicht für jedes Setting geeignet ist.

Georg Winder weist zudem auf didaktische Herausforderungen hin. Die Systeme, die aktuell zur Verfügung stehen – darunter LLM-basierte Systeme wie Chat GPT, Google-Anwendungen sowie lokal betriebene Sprachmodelle seien nicht primär für didaktische Zwecke konzipiert worden. "Deshalb zeigen sich in der Anwendung im Bildungskontext aber noch deutliche Grenzen – insbesondere hinsichtlich der inhaltlichen Genauigkeit und der Fähigkeit, kontextbezogen und konsistent auf komplexe Lernanliegen zu reagieren." Außerdem gibt es laut Winder Lernfelder, für die sprachgesteuerte Tools schlichtweg ungeeignet sind. Das betreffe vor allem visuell-räumliche Situationen wie technisches Zeichnen oder Mathematik. Auch die Akzeptanz der sprachgesteuerten Tools sei derzeit noch ein Thema. Während Lernende häufig mit Interesse und Neugier reagieren, begegnen Lehrpersonen der Technologie oft zurückhaltend oder skeptisch – vor allem aufgrund fehlender didaktischer Einbettung und weil sie selbst wenig Erfahrung damit haben. Dennoch ist Winder sich sicher: "Die steigende Akzeptanz von Voice Interfaces wird unsere Kommunikationsgewohnheiten nachhaltig prägen und auch die Gestaltung von Lernprozessen tiefgreifend verändern."

Sprachassistenten als ergänzendes Werkzeug

Sprachassistenzsysteme können also durchaus neue Wege eröffnen – besonders dann, wenn das Lernen situativ, individualisiert und zugänglich sein soll. Gleichzeitig ist und bleibt Sprachassistenz ein ergänzendes Werkzeug – und Bildung bleibt ein sozialer Prozess. Laut "Star Trek" gibt es schließlich auch im 24. Jahrhundert noch Bücher, Bildschirme sowie Seminare und Vorlesungen in Präsenz. Denn vor allem die zwischenmenschliche Interaktion kann auch in einem Science-Fiction-Szenario kein sprechender Computer ersetzen.





Dieser Beitrag ist erschienen in neues lernen, Ausgabe 4/2025, das Fachmagazin für Personalentwicklung. Lesen Sie das gesamte Heft auch in der App personalmagazin - neues lernen.





