KI-Glossar - Begriffe verständlich erklärt

Worum es geht

Wer mit KI arbeiten will, kommt um eine Handvoll englischer Begriffe nicht herum. Sie wirken sperrig - hinter jedem steckt eine einfache Idee.

Dieses Glossar erklärt die sechs Begriffe, die du am häufigsten hören wirst, in jeweils zwei Absätzen. Plus einen Anhang mit weiteren Begriffen, die seltener wichtig sind, aber gelegentlich auftauchen. Stand: 2026.

Eins

LLM - Large Language Model.

Ein Large Language Model ist die Technologie hinter ChatGPT, Claude, Gemini und ähnlichen Diensten. Es ist im Kern ein Programm, das vorhersagt, welches Wort als nächstes plausibel käme - basierend auf riesigen Textmengen, mit denen es trainiert wurde. Wenn du "Die Hauptstadt von Deutschland ist..." tippst, weiß es: Berlin. Nicht, weil es Berlin kennt, sondern weil Berlin in seinem Training millionenfach auf diesen Anfang folgte.

Das ist keine echte Intelligenz im philosophischen Sinne - aber es ist eine erstaunlich nützliche Imitation. Aus dieser einfachen Grundidee entsteht alles, was du heute als KI erlebst: Texte schreiben, Fragen beantworten, Code generieren, Sprache übersetzen.

Zwei

RAG - Retrieval Augmented Generation.

Ein normales LLM kennt nur das, was zur Trainingszeit bekannt war. Es weiß nichts von deiner Firma, deinen Kunden, deinen Verträgen. RAG ist die Technik, mit der man einem LLM Zugriff auf eigene Dokumente gibt - so, dass es sie beim Antworten heranzieht.

Konkret: Du legst alle deine Dokumente in eine durchsuchbare Sammlung. Bei jeder Frage holt das System zuerst die passenden Dokumente heraus und übergibt sie dem LLM zur Beantwortung. Das Ergebnis: Antworten, die auf deinen echten Daten basieren - nicht auf dem Allgemeinwissen des Modells. Fast jede sinnvolle KI-Anwendung im Mittelstand nutzt heute irgendeine Form von RAG.

Drei

Agent.

Ein KI-Agent ist ein LLM, das nicht nur antwortet, sondern handelt. Es kann Programme bedienen, Mails verschicken, in Datenbanken nachschauen, Aufträge anlegen - in Schritten, die es selbst plant.

Beispiel: Du sagst "Bestätige alle Anfragen aus der letzten Woche, die noch unbeantwortet sind, mit einer Standardantwort." Ein Agent schaut nach, welche Anfragen offen sind, formuliert die Antworten, verschickt sie. Das ist die nächste Generation der KI-Anwendung - aber es ist auch die gefährlichere. Agenten brauchen klare Grenzen, was sie tun dürfen, und am besten ein Vier-Augen-Prinzip bei allem, was Konsequenzen hat.

Vier

Halluzination.

Wenn ein LLM eine Antwort gibt, die plausibel klingt, aber sachlich falsch ist - nennt man das eine Halluzination. Es ist kein Fehler im engeren Sinne, sondern eine Folge der Funktionsweise: Das Modell sagt voraus, was wahrscheinlich passt - nicht, was wahr ist.

Halluzinationen sind das größte Risiko beim KI-Einsatz. Sie sind besonders gefährlich, weil sie überzeugend klingen. Eine erfundene Telefonnummer, ein falscher Paragraph, eine Quellenangabe, die es nicht gibt. Schutz: Wichtige Fakten immer nachprüfen, KI-Antworten als Vorschlag, nicht als Wahrheit behandeln, RAG einsetzen, damit das Modell aus echten Dokumenten arbeitet.

Fünf

Embedding und Vektordatenbank.

Ein Embedding ist eine mathematische Übersetzung von Text in Zahlen. Genauer: jeder Text wird zu einer Liste von einigen hundert oder tausend Zahlen, die seine Bedeutung beschreiben. Texte mit ähnlicher Bedeutung haben ähnliche Zahlenmuster - auch wenn sie ganz andere Wörter benutzen.

Eine Vektordatenbank ist ein Speicher, der mit diesen Embeddings umgehen kann. Du legst alle deine Dokumente als Embeddings ab. Bei einer Frage wird die Frage selbst auch zu einem Embedding - und die Datenbank findet die Dokumente, die in der Bedeutung am nächsten dran sind. Das ist die technische Grundlage von RAG (siehe oben).

Sechs

KI-Stichtag und Trainingsdaten.

Jedes LLM wurde zu einem bestimmten Zeitpunkt trainiert. Was nach diesem Stichtag passierte, weiß es nicht - es sei denn, es bekommt aktuelle Informationen über RAG oder einen Internetzugang. Das ist der Grund, warum ChatGPT auf die Frage nach heutigem Wetter oder dem aktuellen Bundeskanzler manchmal veraltete Antworten gibt.

Trainingsdaten sind die Texte, mit denen das Modell gelernt hat. Bei den großen Modellen sind das Milliarden von Webseiten, Büchern, wissenschaftlichen Artikeln und Code-Beispielen. Was im Training nicht vorkam, kennt das Modell auch nicht. Was besonders häufig vorkam, beherrscht es besonders gut.

Weitere Begriffe in Kürze

Token

Die kleinste Texteinheit, mit der ein LLM rechnet. Ungefähr ein dreiviertel Wort. Wenn ein Anbieter "100.000 Token Kontext" sagt, heißt das: das Modell kann etwa 75.000 Wörter auf einmal verarbeiten.

Prompt

Die Eingabe, die du dem Modell gibst. Ein guter Prompt enthält die Aufgabe, den Kontext und ein Beispiel. Prompt Engineering nennt man die Kunst, gute Prompts zu schreiben.

Fine-Tuning

Nachtraining eines fertigen Modells auf eigene Daten, damit es ein spezielles Thema besser beherrscht. Aufwendig, lohnt sich für die meisten KMU nicht - RAG ist meistens die bessere Wahl.

Open-Source-Modell

LLM, dessen Gewichte öffentlich verfügbar sind. Kann auf eigenen Servern betrieben werden. Beispiele: Llama (Meta), Mistral. Wichtig, wenn du Daten auf keinen Fall an US-Anbieter geben darfst.

Context Window

Die Menge an Text, die ein Modell auf einmal verarbeiten kann. 8.000, 100.000 oder zwei Millionen Token - je nach Modell. Größer ist nicht immer besser; mehr Kontext kostet mehr.

Multimodal

Modelle, die nicht nur Text, sondern auch Bilder, Audio oder Video verarbeiten können. Praktisch bei der Auswertung von Scans, Fotos von Belegen oder gesprochenen Aufnahmen.

Inference

Der Vorgang, bei dem ein fertiges Modell eine Antwort erzeugt. Das ist die teure Rechenleistung, die jeder Anfrage entspricht - und sie bestimmt die laufenden Kosten von KI-Anwendungen.

Temperature

Eine Einstellung, die bestimmt, wie kreativ oder konservativ das Modell antwortet. Niedrig: präzise, wiederholbar. Hoch: variantenreich, manchmal überraschend. Für Fakten: niedrig. Für Texte: höher.

MCP - Model Context Protocol

Ein Standard von Anthropic (Ende 2024), mit dem KI-Modelle einheitlich auf eigene Datenquellen und Werkzeuge zugreifen können. Wird in den nächsten Jahren in vielen Anwendungen auftauchen.

Tool Use / Function Calling

Die Fähigkeit eines LLM, externe Programme aufzurufen - eine Datenbank abzufragen, eine Mail zu versenden, eine Berechnung durchführen zu lassen. Grundlage für Agenten.

Bias

Verzerrungen, die ein Modell aus seinen Trainingsdaten übernimmt. Wenn die Daten unausgewogen sind, sind die Antworten es auch. Wichtig bei Personalentscheidungen, Kreditbewertungen und ähnlich sensiblen Themen.

Guardrails

Schutzschichten um ein Modell, die bestimmte Anfragen oder Antworten blockieren. Wichtig, damit Nutzer das Modell nicht zu Aussagen verleiten können, die rechtlich oder rufschädigend sind.

Foundation Model

Ein großes, allgemein trainiertes Basismodell, auf dem viele spezialisierte Anwendungen aufbauen. Beispiele: GPT-4, Claude, Gemini. Werden von wenigen Firmen entwickelt, von vielen genutzt.

Generative KI

Sammelbegriff für KI-Systeme, die Inhalte erzeugen können - Texte, Bilder, Audio, Video, Code. Im Gegensatz zur klassischen analytischen KI, die nur erkennt und klassifiziert.

Wenn dir ein Begriff fehlt

Dieses Glossar wächst mit dem, was wir von Kunden gefragt werden. Wenn dir ein wichtiger Begriff fehlt, schreib uns - wir ergänzen ihn.

KI-Vokabular ist nicht statisch. Was 2024 Mainstream war, kann 2026 veraltet sein - und neue Begriffe kommen ständig dazu. Wir versuchen, diese Liste aktuell zu halten, ohne sie mit Modewörtern zu überladen.

Wenn du tiefer in die Themen willst

Die ausführlichen Hintergrundseiten zur KI findest du verlinkt - oder schreib uns mit deiner konkreten Frage.

Was KI grundlegend ist, steht unter Was ist eigentlich KI?. Was KI heute leistet, steht unter Was KI möglich macht. Was sie nicht kann, steht unter Was KI nicht kann, auch wenn es so wirkt.

Lass uns reden ← Zur Wissensdatenbank

KI-Glossar.