Die wichtigsten Begriffe rund um Künstliche Intelligenz, in einfacher Sprache erklärt. Sechs zentrale Begriffe ausführlich, dazu eine kompakte Liste der übrigen.
Wer mit KI arbeiten will, kommt um eine Handvoll englischer Begriffe nicht herum. Sie wirken sperrig - hinter jedem steckt eine einfache Idee.
Dieses Glossar erklärt die sechs Begriffe, die du am häufigsten hören wirst, in jeweils zwei Absätzen. Plus einen Anhang mit weiteren Begriffen, die seltener wichtig sind, aber gelegentlich auftauchen. Stand: 2026.
Ein Large Language Model ist die Technologie hinter ChatGPT, Claude, Gemini und ähnlichen Diensten. Es ist im Kern ein Programm, das vorhersagt, welches Wort als nächstes plausibel käme - basierend auf riesigen Textmengen, mit denen es trainiert wurde. Wenn du "Die Hauptstadt von Deutschland ist..." tippst, weiß es: Berlin. Nicht, weil es Berlin kennt, sondern weil Berlin in seinem Training millionenfach auf diesen Anfang folgte.
Das ist keine echte Intelligenz im philosophischen Sinne - aber es ist eine erstaunlich nützliche Imitation. Aus dieser einfachen Grundidee entsteht alles, was du heute als KI erlebst: Texte schreiben, Fragen beantworten, Code generieren, Sprache übersetzen.
Ein normales LLM kennt nur das, was zur Trainingszeit bekannt war. Es weiß nichts von deiner Firma, deinen Kunden, deinen Verträgen. RAG ist die Technik, mit der man einem LLM Zugriff auf eigene Dokumente gibt - so, dass es sie beim Antworten heranzieht.
Konkret: Du legst alle deine Dokumente in eine durchsuchbare Sammlung. Bei jeder Frage holt das System zuerst die passenden Dokumente heraus und übergibt sie dem LLM zur Beantwortung. Das Ergebnis: Antworten, die auf deinen echten Daten basieren - nicht auf dem Allgemeinwissen des Modells. Fast jede sinnvolle KI-Anwendung im Mittelstand nutzt heute irgendeine Form von RAG.
Ein KI-Agent ist ein LLM, das nicht nur antwortet, sondern handelt. Es kann Programme bedienen, Mails verschicken, in Datenbanken nachschauen, Aufträge anlegen - in Schritten, die es selbst plant.
Beispiel: Du sagst "Bestätige alle Anfragen aus der letzten Woche, die noch unbeantwortet sind, mit einer Standardantwort." Ein Agent schaut nach, welche Anfragen offen sind, formuliert die Antworten, verschickt sie. Das ist die nächste Generation der KI-Anwendung - aber es ist auch die gefährlichere. Agenten brauchen klare Grenzen, was sie tun dürfen, und am besten ein Vier-Augen-Prinzip bei allem, was Konsequenzen hat.
Wenn ein LLM eine Antwort gibt, die plausibel klingt, aber sachlich falsch ist - nennt man das eine Halluzination. Es ist kein Fehler im engeren Sinne, sondern eine Folge der Funktionsweise: Das Modell sagt voraus, was wahrscheinlich passt - nicht, was wahr ist.
Halluzinationen sind das größte Risiko beim KI-Einsatz. Sie sind besonders gefährlich, weil sie überzeugend klingen. Eine erfundene Telefonnummer, ein falscher Paragraph, eine Quellenangabe, die es nicht gibt. Schutz: Wichtige Fakten immer nachprüfen, KI-Antworten als Vorschlag, nicht als Wahrheit behandeln, RAG einsetzen, damit das Modell aus echten Dokumenten arbeitet.
Ein Embedding ist eine mathematische Übersetzung von Text in Zahlen. Genauer: jeder Text wird zu einer Liste von einigen hundert oder tausend Zahlen, die seine Bedeutung beschreiben. Texte mit ähnlicher Bedeutung haben ähnliche Zahlenmuster - auch wenn sie ganz andere Wörter benutzen.
Eine Vektordatenbank ist ein Speicher, der mit diesen Embeddings umgehen kann. Du legst alle deine Dokumente als Embeddings ab. Bei einer Frage wird die Frage selbst auch zu einem Embedding - und die Datenbank findet die Dokumente, die in der Bedeutung am nächsten dran sind. Das ist die technische Grundlage von RAG (siehe oben).
Jedes LLM wurde zu einem bestimmten Zeitpunkt trainiert. Was nach diesem Stichtag passierte, weiß es nicht - es sei denn, es bekommt aktuelle Informationen über RAG oder einen Internetzugang. Das ist der Grund, warum ChatGPT auf die Frage nach heutigem Wetter oder dem aktuellen Bundeskanzler manchmal veraltete Antworten gibt.
Trainingsdaten sind die Texte, mit denen das Modell gelernt hat. Bei den großen Modellen sind das Milliarden von Webseiten, Büchern, wissenschaftlichen Artikeln und Code-Beispielen. Was im Training nicht vorkam, kennt das Modell auch nicht. Was besonders häufig vorkam, beherrscht es besonders gut.
Dieses Glossar wächst mit dem, was wir von Kunden gefragt werden. Wenn dir ein wichtiger Begriff fehlt, schreib uns - wir ergänzen ihn.
KI-Vokabular ist nicht statisch. Was 2024 Mainstream war, kann 2026 veraltet sein - und neue Begriffe kommen ständig dazu. Wir versuchen, diese Liste aktuell zu halten, ohne sie mit Modewörtern zu überladen.
Was KI grundlegend ist, steht unter Was ist eigentlich KI?. Was KI heute leistet, steht unter Was KI möglich macht. Was sie nicht kann, steht unter Was KI nicht kann, auch wenn es so wirkt.