Wie sehr diskriminiert künstliche Intelligenz?
29. Mai 2026, von Lauscher/Red.

Foto: Sarah Buth
Die UHH ist wissenschaftliche Heimat von mehr als 6.200 Forschenden. Alle zwei Wochen geben wir in der Reihe „Forschen und Verstehen“ im Hamburger Abendblatt Einblick in ihre Arbeit. Welche Folgen es hat, dass die Trainingsdaten der KI auch unsere Stereotype widerspiegeln, erklärt Prof. Dr. Anne Lauscher in der aktuellen Ausgabe.
ChatGPT, DeepL, Dall-E: KI-Anwendungen erstellen Texte, Bilder oder Videos – und spiegeln dabei immer auch unsere soziale Realität. Denn auch wenn es sich Nutzende nicht bewusst machen, werden diese Systeme mit Unmengen an Daten trainiert, in denen unsere Werte, aber auch Stereotype abgebildet sind. Das führt dazu, dass ChatGPT und Co. uns zwar den Alltag erleichtern, aber auch problematische und unethische Auswirkungen haben können, wenn sie rassistische, antisemitische oder queer-feindliche Einstellungen wiedergeben.
Da sich KI mit großer Geschwindigkeit entwickelt und inzwischen fast alle Bereiche unseres Lebens tiefgreifend beeinflusst, müssen wir dem entgegenwirken. Ich möchte dazu beitragen, KI so zu gestalten und einzusetzen, dass sie verantwortungsvoll entwickelt wird und einen positiven gesellschaftlichen Nutzen entfaltet.
Diskriminierung durch KI messbar machen
Einer der Schwerpunkte meiner Forschung ist es, Diskriminierung durch KI aufzuzeigen und messbar zu machen, denn wir müssen im ersten Schritt verstehen, wen die Anwendungen wie benachteiligen. Wir arbeiten überwiegend mit Methoden der empirischen KI-Forschung, das heißt, wir führen groß angelegte Experimente durch, um bestimmte Effekte zu untersuchen und quantitativ zu erfassen. Dazu geben wir zum Beispiel von uns entwickelte Sprachbefehle in die KI ein und vergleichen die Ergebnisse, die wir mit verschiedenen Eingabesprachen bekommen. Darüber hinaus setzen wir auf sogenannte Mixed-Methods-Ansätze und kombinieren Experimente mit Umfragen oder Interviews, um gesellschaftliche Dimensionen besser verstehen zu können.
Es ist inzwischen vielfach belegt, dass es bei den KI-Modellen abhängig von der Eingabesprache große Unterschiede bei der Verlässlichkeit gibt. Wenn ich auf Englisch frage, kommt es zu deutlich weniger falschem Output als etwa bei Eingaben in Koreanisch. In einem unserer aktuellen Projekte sehen wir zudem, dass auch innerhalb einer Sprache diskriminiert wird: Large Language Models wie ChatGPT trauen Sprecherinnen und Sprechern mit einem Dialekt wie Plattdeutsch bei Fragen nach möglichen Karrierewegen deutlich weniger zu und assoziieren sie im Vergleich mit Hochdeutsch Sprechenden häufiger mit Begriffen wie ‚ungebildet‘ oder ‚engstirnig‘. Diese Vorurteile herrschten lange auch in der Gesellschaft und werden nun von den Chatbots wiederbelebt.
Sprachbasierte Anwendungen im Fokus
Neben den Arbeiten zu textbasierten KI-Anwendungen finalisieren wir gerade eine Studie, in der wir erstmals einen Zusammenhang zwischen der Stimmlage – dem Pitch – und Diskriminierung durch Audio-Language-Modelle aufzeigen. Diese Art von KI-Modellen kann direkt über Sprache bedient werden – und unsere Ergebnisse legen nahe, dass die Diskriminierung teils sogar stärker ausgeprägt ist als bei textbasierten Systemen. Menschen mit höherer, vermeintlich weiblicher Stimmlage erhalten andere Ergebnisse als Anfragen in tieferen Stimmlagen, und ihnen werden von der KI stereotype Eigenschaften wie ‚sanft‘ oder ‚gemeinschaftsorientiert‘ zugeschrieben.
Diese Ergebnisse sind besonders relevant, da wir davon ausgehen, dass Audio-Language-Modelle künftig breiter zugänglich sein werden als rein textbasierte Systeme. Das bedeutet, dass Nutzende nicht schreiben können müssen. Bisher waren KI-Anwendungen Menschen mit geringen Lese- und Schreibfähigkeiten nur eingeschränkt zugänglich und dass sich das ändert, ist sehr positiv. Allerdings haben Betroffene häufig auch eine geringere digitale Kompetenz und sind diesen Verzerrungen damit stärker ausgesetzt.
Teil unserer Forschung ist daher auch, Trainingsmethoden für KI-Systeme zu entwickeln, um Diskriminierung zu reduzieren bzw. bei neuen Anwendungen zu vermeiden. Insbesondere in sensiblen Anwendungsbereichen wie Personaldienstleistungen müssen sie gerecht arbeiten. Dass das geht, zeigt unsere Arbeit: Mit der richtigen Datengrundlage sind diese Systeme gestaltbar – aber nur, wenn man Voreingenommenheit robust misst, betroffene Gruppen und Kontexte explizit mitdenkt, sie in die Forschung einbezieht und Gegenstrategien konsequent evaluiert.
Zur Person
Prof. Dr. Anne Lauscher forscht seit 2022 an der Universität Hamburg. Ihre Professur für Trustworthy Artificial Intelligence ist eine von drei Open-Topic-Professuren, die im Rahmen der Exzellenzstrategie des Bundes und der Länder gefördert werden. Sie forscht unter anderem in der universitären Profilinitiative „Digital Sustainability Transformation“. Ihre Lieblings-KI-Anwendungen sind Programme zur Maschinellen Übersetzung, weil sie das Potenzial haben, Sprecherinnen und Sprecher unterschiedlicher Sprachen näher zusammenzubringen.

