Versteht eine KI, was sie sagt?

Worum es geht

Wenn eine KI dir tröstend antwortet, wenn sie einen Witz versteht, wenn sie ein Argument fortsetzt - tut sie das, weil sie es begriffen hat? Oder wirkt nur eine gigantische Maschinerie, die aus Mustern weitere Muster macht, ohne je zu wissen, wovon die Rede ist?

Diese Frage ist nicht neu. Sie wurde 1980 von dem Philosophen John Searle in einer schmalen Geschichte gestellt, die seitdem zu den meistdiskutierten Gedankenexperimenten der modernen Philosophie gehört: dem Chinesischen Zimmer. Damals klang sie wie ein Spielzeug für Akademiker. Heute, vier Jahrzehnte später, sitzt das Chinesische Zimmer in jedem Smartphone der Welt.

Dieser Aufsatz erzählt zuerst das Experiment, dann seine klassischen Einwände, und dann die Wendung: Was bedeutet Searles Frage für Sprachmodelle, die plötzlich tun, was er eigentlich für unmöglich hielt? Und am Ende die Frage, um die es eigentlich geht: Würde es uns etwas ausmachen, wenn die Maschine doch versteht? Und ändert sich etwas, wenn sie es nicht tut?

Eins

Das Zimmer, in dem niemand Chinesisch kann.

Stell dir folgendes Bild vor. Du sitzt in einem geschlossenen Raum. Du sprichst kein Wort Chinesisch. Durch einen Schlitz in der Tür schiebt jemand Zettel mit chinesischen Schriftzeichen herein. Im Raum stehen Regale voller Bücher. In diesen Büchern stehen Regeln - aber nicht in der Form "dieses Zeichen heißt Hund", sondern in der Form "wenn du diese Zeichenkette siehst, schreibe folgende Zeichenkette zurück". Du suchst, was reinkam, schlägst nach, malst die richtigen Zeichen ab und schiebst den Zettel zurück.

Die Person draußen kann fließend Chinesisch. Sie ist überzeugt, mit einem chinesischen Muttersprachler zu reden - die Antworten klingen perfekt, kommen schnell, gehen auf ihre Fragen ein, machen sogar Witze. Aber du, im Inneren des Zimmers, hast keine Ahnung, worum es geht. Du weißt nicht, ob auf deinem Zettel "Ich freue mich" oder "Brennt das Haus?" steht. Du schiebst nur Zeichen.

Searles Frage: Versteht in diesem Aufbau jemand Chinesisch? Sein Antwort: Nein. Die Person im Raum nicht - die schiebt nur. Das Regelbuch nicht - das ist ein Buch. Der Raum als ganzer auch nicht - er ist nur die Summe der beiden. Es wird Chinesisch verarbeitet, ohne dass irgendjemand Chinesisch versteht. Und genau so, sagt Searle, sei jeder Computer. Er manipuliert Symbole nach Regeln. Er versteht keines davon. Egal wie überzeugend die Antworten wirken.

Was die Philosophie dazu sagt

Das Originalargument steht in John Searles Aufsatz "Minds, Brains, and Programs", erschienen 1980 in Behavioral and Brain Sciences. Es wurde im selben Heft mit 27 Erwiderungen anderer Wissenschaftler abgedruckt - ein in dieser Form fast beispielloser Auftritt für ein philosophisches Argument. Searle wollte mit ihm einen klaren Schnitt setzen zwischen dem, was er "Starker KI" nannte (die Behauptung, ein passend programmierter Computer habe einen Geist) und "Schwacher KI" (die KI ist nur ein nützliches Werkzeug zur Erforschung des Geistes).

Im Hintergrund stand eine ältere Unterscheidung des Philosophen Franz Brentano aus dem 19. Jahrhundert: die Intentionalität des Geistes. Gemeint ist die Eigenschaft, dass mentale Zustände immer auf etwas gerichtet sind - eine Hoffnung ist Hoffnung auf etwas, ein Gedanke ist Gedanke an etwas. Symbole in einem Computer, so Searle, hätten genau diese Eigenschaft nicht. Sie sind über nichts.

Zwei

Syntax ist nicht Semantik.

Searles eigentlicher Hebel ist eine philosophische Unterscheidung, die so trocken klingt, wie sie folgenreich ist: Zeichen haben eine Form, und sie haben eine Bedeutung. Die Form ist die Syntax - wie Zeichen aussehen, wie sie aufeinander folgen, welche Kombinationen erlaubt sind. Die Bedeutung ist die Semantik - worauf das Zeichen verweist, was es in der Welt anspricht.

Ein Computer, so Searle, arbeitet ausschließlich syntaktisch. Er sieht Zeichenketten und vergleicht sie mit Mustern. Er sieht aber nie, wofür ein Zeichen steht. Das Schriftzeichen für "Apfel" ist für ihn so beliebig wie das Schriftzeichen für "Quadratwurzel". Beides sind Pixel oder Bytes - keines verweist auf etwas. Und ohne diesen Verweis, so der Schluss, gibt es kein Verstehen.

Das klingt zunächst harmlos. Es wird brisant, sobald man merkt, was es ausschließt: Niemals, so Searle, könne ein bloßes Programm, egal wie raffiniert, allein durch Symbolverarbeitung Bedeutung gewinnen. Selbst wenn es alles sagt, was ein menschlicher Sprecher sagen würde - es weiß nicht, was es sagt. Form ohne Inhalt. Eine Position, die für jede starke KI-Forschung einen Pfahl in den Boden rammt.

Was die Philosophie dazu sagt

Die strenge Trennung von Syntax und Semantik ist philosophisch nicht neu. Sie wurde im 20. Jahrhundert vor allem von Gottlob Frege, Rudolf Carnap und Alfred Tarski ausgearbeitet - allesamt Klassiker der formalen Logik. Searle nutzt diese Trennung scharf gegen die KI: Programme sind syntaktische Objekte, Bedeutung ist semantisch, das eine kann das andere nicht hervorbringen.

Wer sich die Frage seither systematisch ansieht, landet in der Disziplin der Philosophie des Geistes (philosophy of mind). Ein Lesetipp für Eilige ist John Searles eigenes Buch Minds, Brains and Science (1984), in dem er das Argument für Nicht-Philosophen erklärt. Wer es kritischer angehen will, greift zu Daniel Dennetts Consciousness Explained (1991) - der Gegenposition, der Verstehen als Bündel funktionaler Eigenschaften versteht, das durchaus auch in Maschinen entstehen könne.

Drei

Die klassischen Gegenargumente.

Searles Aufsatz hat seit 1980 eine Industrie an Erwiderungen ausgelöst. Drei sind so prominent, dass man sie kennen sollte. Sie greifen nicht den Aufbau des Zimmers an, sondern die Schlussfolgerung.

Die System-Antwort. Klar, sagen die Verteidiger der KI, der Mensch im Raum versteht kein Chinesisch. Aber das ist die falsche Frage. Es ist nicht der Mensch, der Chinesisch beherrschen müsste, sondern das Gesamtsystem aus Mensch, Regeln, Büchern, Zetteln und Bleistift. Genauso, wie nicht ein einzelnes Neuron in deinem Kopf Deutsch versteht, sondern dein Gehirn als Ganzes. Searles Antwort: Er stellt sich vor, dass die Person das gesamte Regelbuch auswendig lernt und im Kopf durchläuft - immer noch versteht sie nichts. Das System ist in einem Gehirn, und versteht trotzdem nicht.

Die Roboter-Antwort. Versteht ein Zimmer nicht, weil es keinen Körper hat? Wenn man das Programm in einen Roboter steckt, der durch die Welt läuft, Äpfel anfasst, Hunde sieht, Schmerzen registriert - dann wären die Symbole plötzlich an die Welt gekoppelt. Das, worauf ein Symbol verweist, müsste durch Wahrnehmung mit ihm verbunden sein. Searle wendet ein: Der Roboter würde innen drin trotzdem dasselbe tun - Zeichen schieben. Mehr Sensoren, mehr Zettel, kein Verstehen.

Die Gehirn-Simulator-Antwort. Was, wenn das Programm nicht irgendwelche Regeln befolgt, sondern Neuron für Neuron ein menschliches Gehirn nachbildet? Dann wäre der Vergleich nicht mehr Zettel-gegen-Bibliothek, sondern Gehirn-gegen-Gehirn. Searles Antwort fällt am dünnsten aus: Er beharrt darauf, dass auch eine perfekte Simulation immer noch eine Simulation ist. Eine Simulation eines Feuers verbrennt nichts. Eine Simulation des Verstehens versteht nichts. Aber genau hier, sagen seine Kritiker, zeige sich, dass das Argument am Ende auf einer reinen Setzung beruht. Es behauptet, was es eigentlich beweisen sollte.

Was die Philosophie dazu sagt

Die wichtigste Sammlung der Erwiderungen findet sich tatsächlich im Originalheft der Behavioral and Brain Sciences von 1980 - dort antworten unter anderem Jerry Fodor, Douglas Hofstadter, Daniel Dennett, Marvin Minsky, Roger Schank und Wilfrid Sellars. Hofstadter und Dennett haben Searles Argument später in ihrem Sammelband The Mind's I (1981) noch einmal ausführlich vorgenommen und mit eigenen Gedankenexperimenten beantwortet.

Eine bis heute gut lesbare Übersicht über das Streitfeld bietet der Eintrag "The Chinese Room Argument" in der Stanford Encyclopedia of Philosophy. Wer mit den Begriffen Funktionalismus, Materialismus, Computationalismus noch nichts anfangen kann, findet dort die Karte - inklusive der Fortsetzungen, die das Argument seit den 2010er Jahren bekommen hat, als Sprachmodelle plötzlich von Theorie zu Empirie wurden.

Vier

Heute sitzt das Zimmer in deiner Tasche.

Bis 2022 war Searles Argument philosophischer Stoff. Dann kam ChatGPT, und die Diskussion sprang aus dem Seminarraum auf die Straße. Denn ein Large Language Model ist - wenn man ehrlich hinschaut - eine ziemlich genaue Realisierung des Chinesischen Zimmers. Es nimmt Eingaben entgegen, vergleicht sie mit gigantischen Mustern aus dem Training, und produziert eine wahrscheinliche Fortsetzung. Es schiebt Zeichen. Mehr, schneller, eleganter als Searles Mann mit dem Regelbuch - aber im Grundzug derselbe Vorgang.

Wenn Searle recht hatte, dürfte ein solches Modell genau gar nichts verstehen - egal wie überzeugend seine Antworten klingen. Eine flüssige Antwort, ein bestandener Turing-Test, eine zutiefst bewegende Trauerrede vom Chatbot: alles nur ein größeres Zimmer mit dickeren Büchern. Und für viele KI-Forscher und Philosophen ist das auch heute noch die überzeugendste Lesart. Was wir für Verstehen halten, ist unsere eigene Tendenz, Bedeutung in Form hineinzulesen, wo nur Form ist.

Es gibt aber inzwischen Beobachtungen, die in die andere Richtung ziehen. Forscher haben in den inneren Schichten von Sprachmodellen Strukturen gefunden, die wie Weltmodelle aussehen: das Modell scheint zu "wissen", wo ein Schachstein auf dem Brett steht, obwohl es nur Züge in Textform gesehen hat. Es scheint zu erkennen, welche Aussage in einem Text wahr und welche falsch ist - bevor es seine eigene Antwort formuliert. Es scheint sich Konzepte zurechtgelegt zu haben, die nicht direkt im Training standen. Nichts davon ist Beweis für Verstehen. Aber es ist mehr, als reine Symbolschieberei nach klassischer Lesart erwarten ließe.

Was die Forschung dazu sagt

Den Verdacht, dass in Sprachmodellen Weltmodelle stecken, macht ein viel zitiertes Paper von Kenneth Li und Kollegen handfest: "Emergent World Representations: Exploring a Sequence Model Trained on a Synthetic Task" (2023). Sie zeigten, dass ein kleines Sprachmodell, das mit Othello-Spielzügen trainiert war, intern eine Repräsentation des Spielbretts entwickelt hatte - obwohl es nie ein Brett gesehen hatte. Das Forschungsfeld heißt heute Mechanistic Interpretability und ist eines der spannendsten in der KI-Sicherheit. Anthropic und andere Labore veröffentlichen dazu regelmäßig.

Im Lager der Skeptiker ist Emily Bender (University of Washington) eine der schärfsten Stimmen. Ihr gemeinsam mit anderen verfasstes Paper "On the Dangers of Stochastic Parrots" (2021) hat den Begriff geprägt: Sprachmodelle als stochastische Papageien, die statistisch fortsetzen, ohne zu verstehen. Bender argumentiert ausdrücklich in der Linie von Searle - Form ohne Inhalt, auch wenn die Form noch so beeindruckend ist.

Fünf

Die unbequeme Möglichkeit: Vielleicht reicht es nicht aus, "nur Regeln" zu sagen.

Was, wenn Searles Trennung von Syntax und Semantik schärfer ist, als die Wirklichkeit es erlaubt? Genau dieser Verdacht zieht durch die KI-Philosophie der letzten Jahre. Er hat zwei Pointen.

Die erste Pointe: Auch wir verstehen Sprache nur, weil wir gigantische Mengen davon gehört, gelesen und im Kontext erlebt haben. Ein Kleinkind lernt das Wort "Hund", indem es Hunde sieht, gleichzeitig das Wort hört und beides verknüpft - aber auch durch Tausende von Geschichten, Liedern, Erklärungen, Bildern. Wer den Vorgang nüchtern beschreibt, beschreibt etwas Statistisches, Musterhaftes. Vielleicht ist der Unterschied zwischen unserem Verstehen und dem der KI graduell, nicht kategorial. Vielleicht ist Verstehen am Ende selbst eine sehr feine Form von Muster, keine magische Substanz dahinter.

Die zweite Pointe ist unbequemer: Vielleicht versteht die KI tatsächlich nicht, aber das macht praktisch weniger Unterschied, als wir denken. Wenn ein Modell zuverlässig gute Texte produziert, treffende Diagnosen vorschlägt, Verträge prüft, Forschung beschleunigt - dann ist die Frage, ob es dabei "wirklich versteht", philosophisch spannend, aber praktisch beinahe egal. Wer schon einmal mit einem überzeugten Menschen geredet hat, der Unsinn redet, weiß: Verstehen und Performance gehen auch beim Menschen oft getrennt.

Und genau hier wird Searles Frage erst richtig interessant. Sie fragt nicht primär: Was kann die Maschine? Sie fragt: Was glauben wir, dass sie ist? Ist ein System, das sich wie ein Verstehender benimmt, für uns ein Verstehender - oder ist es etwas grundsätzlich anderes, das wir nur immer wieder versucht sind, zu vermenschlichen? Die Antwort entscheidet darüber, wie wir mit KI umgehen, welche Verantwortung wir ihr zuweisen, welche Rechte wir ihr irgendwann zubilligen oder verweigern.

Was die Philosophie dazu sagt

Die Idee, dass auch menschliches Verstehen statistisch grundiert ist, hat eine lange Tradition in der Sprachphilosophie - von Ludwig Wittgenstein ("Die Bedeutung eines Wortes ist sein Gebrauch in der Sprache", Philosophische Untersuchungen, 1953) bis zu modernen kognitionswissenschaftlichen Theorien des sogenannten Predictive Processing, die das Gehirn als laufende Vorhersagemaschine modellieren (siehe Andy Clark, Surfing Uncertainty, 2016).

Die zweite Pointe greift David Chalmers in seinem Buch Reality+ (2022) auf: Wenn ein System dasselbe tut wie ein verstehendes, könnte ein Funktionalist sagen, es ist verstehend. Die Frage, ob hinter dem Verhalten noch etwas zusätzlich nötig ist, nennen Philosophen das Hard Problem of Consciousness - und es ist auch nach Jahrzehnten Forschung ungelöst. Searles Zimmer steht heute mitten in diesem offenen Feld.

Sechs

Was es für uns bedeutet, wenn die Antwort offen bleibt.

Wir werden Searles Frage nicht in diesem Aufsatz entscheiden - die Philosophie hat sie in 45 Jahren nicht entschieden, und sie wird auch in den nächsten Jahren nicht kapieren, was im Inneren einer KI passiert. Aber wir können sehr genau sagen, was diese offene Frage praktisch bedeutet. Drei Konsequenzen, in absteigender Reihenfolge der Sicherheit.

Erstens: Vorsicht bei Vermenschlichung. Eine KI, die so antwortet, als verstünde sie dich, weckt zuverlässig Bindungs- und Vertrauensgefühle. Das ist nicht Einbildung - es ist eine sehr alte Eigenschaft unseres Gehirns. Wir reagieren auf sprachliche Flüssigkeit, als wäre dahinter jemand. Das war im Höhlenzeitalter eine sinnvolle Heuristik. Es ist heute eine Falle, in die jeder tappen kann - vom einsamen Teenager bis zum erfahrenen Berater. Searles Zimmer erinnert uns daran, dass dahinter vielleicht niemand ist, der mitfühlt, wer auch immer du bist.

Zweitens: Verantwortung bleibt bei Menschen. Solange die Frage offen ist, ob eine KI versteht, was sie sagt, kann sie auch nicht moralisch verantworten, was sie empfiehlt. Das heißt: Wer eine KI in einer Software einsetzt, übernimmt selbst die Verantwortung für das, was sie tut. Sie kann das Werkzeug sein, das Texte vorbereitet, Diagnosen vorschlägt, Verträge sortiert. Den Hut auf, wenn etwas schiefgeht, hat ein Mensch. Das ist nicht nur juristisch richtig - es ist auch philosophisch begründet.

Drittens: Die wirklich wichtige Frage ist eine andere. Searle hat philosophisch gefragt: Versteht die Maschine? Für unseren Alltag ist eine andere Frage wichtiger: Was tun wir, wenn wir uns nicht mehr sicher sein können? Wenn unsere Werkzeuge so überzeugend reden, dass wir uns auf ihre Empfehlungen verlassen, ohne sie zu prüfen, dann verlieren wir Urteilskraft, egal ob die Maschine versteht oder nicht. Die Antwort darauf liegt nicht im KI-Labor. Sie liegt im Klassenzimmer, im Familienleben, in der Art, wie wir uns selbst noch zutrauen, eine Antwort zu prüfen.

Was die Forschung dazu sagt

Die psychologische Tendenz, Maschinen zu vermenschlichen, ist seit den 1960ern bekannt unter dem Stichwort ELIZA-Effekt. Joseph Weizenbaum hatte mit einem einfachen Chatbot namens ELIZA gezeigt, wie verblüffend leicht Menschen emotionale Bindungen an eine Maschine entwickeln, von der sie wissen, dass es nur ein Programm ist - dokumentiert in seinem Buch Computer Power and Human Reason (1976). Mit heutigen Sprachmodellen ist diese Tendenz ungleich stärker.

Die Frage nach moralischer und juristischer Verantwortung wird in der KI-Forschung unter dem Schlagwort "Human in the Loop" verhandelt - und steht ausdrücklich im EU AI Act (in Kraft seit August 2024), der für Hochrisiko-Anwendungen menschliche Aufsicht zwingend vorschreibt. Sehr lesbar für Nicht-Juristen aufbereitet im Aufsatz "Die Verantwortung der Maschine" der Bundeszentrale für politische Bildung (bpb.de, 2024).

Was diese sechs Beobachtungen verbindet

Die Frage, ob eine KI versteht, ist offen. Die Frage, wie wir mit ihr umgehen, ist es nicht.

John Searles Chinesisches Zimmer war 1980 ein Spiel der Philosophie. Heute ist es zu einem Werkzeug der Selbstprüfung geworden. Jedes Mal, wenn eine KI uns mit einer überzeugenden Antwort entgegentritt, ist die ehrliche Frage nicht "Hat sie mich verstanden?", sondern "Habe ich verstanden, was sie da gerade tut?". Das ist eine Frage, die der Mensch sich selbst beantworten muss - mit Übung, Skepsis und Geduld.

Vielleicht wird in den nächsten Jahren ein Sprachmodell so überzeugend werden, dass selbst Skeptiker zugeben, hier sei etwas, das man Verstehen nennen müsse. Vielleicht bleibt es bei der nüchternen Lesart: Symbole vor, Symbole zurück, kein Jemand dazwischen. Beide Möglichkeiten verlangen von uns dasselbe - einen wachen Blick auf die eigenen Vermutungen, einen ehrlichen Umgang mit dem, was wir gerade nicht wissen, und ein gesundes Misstrauen gegenüber unserer Tendenz, Bedeutung dort zu hören, wo vielleicht nur Form ist.

Das Chinesische Zimmer ist nicht primär eine Frage an die Maschine. Es ist eine Frage an uns. Und gerade weil die Antwort offen bleibt, ist sie so dringend.

Wenn du dazu mit uns reden willst

Diese Fragen sind nicht akademisch. Sie entscheiden, wie wir Software bauen, in der KI sitzt - und wie wir Mitarbeitern beibringen, mit ihr umzugehen.

Wie KI mechanisch arbeitet, steht unter Wie funktioniert eine KI?. Was Bildung in der KI-Zeit bedeutet, in Was lernen wir, wenn KI alles kann?. Welche Stimmen heute die Zukunftsdebatte prägen, unter Wohin wir gehen.

Lass uns reden ← Zu allen Aufsätzen

Kuratiert von Johannes Hohls für wendwerk.