Können wir die Zukunft vorhersagen?

Worum es geht

Vorhersagen über die Zukunft sind kein neues Genre. Was neu ist, ist die Menge an alten Vorhersagen, die wir heute überprüfen können - und die Disziplin, die daraus entstanden ist: Prognose-Forensik. Sie schaut systematisch zurück, was Experten vorhergesagt haben, und vergleicht es mit dem, was tatsächlich passiert ist.

Das Ergebnis ist ernüchternd und lehrreich zugleich. Die meisten konkreten Vorhersagen waren falsch, oft auf vorhersagbare Weise. Aber die Muster, in denen sie falsch waren, lassen sich beschreiben - und daraus folgt eine bescheidenere, ehrlichere Art, über die Zukunft zu reden. Dieser Aufsatz ist der Versuch, diese Muster zu zeigen und am Ende zu fragen, was sie für die Prognosen bedeuten, die heute über KI, Wirtschaft und Gesellschaft kursieren.

Eins

Was 1900 über das Jahr 2000 gedacht wurde.

Zum Pariser Weltausstellungsjahr 1900 produzierte der Schokoladenhersteller Hildebrands eine Serie von Sammelkarten "Deutschland in 100 Jahren". Sie zeigt Personentransport per Luftschiff, fahrende Häuser, Wettermaschinen und Rollbürgersteige in den Städten. Im selben Jahr veröffentlichte der amerikanische Ingenieur John Elfreth Watkins im Ladies' Home Journal eine Liste von Vorhersagen für das Jahr 2000. Manche davon sind erstaunlich präzise: drahtlose Telefonie über Kontinente, Farbfotografie aus der Luft in Echtzeit zu Zeitungen, vorgefertigte Fertigmahlzeiten. Andere sind weit daneben: pneumatische Postrohrnetze unter Großstädten, Buchstaben C, X und Q aus dem Alphabet verschwunden, Erdbeeren in Apfelgröße.

Das Muster, das man hier zum ersten Mal sieht, wiederholt sich durch das ganze Jahrhundert: Technische Einzelpunkte werden erstaunlich oft getroffen. Die Gesellschaft, in der sie stattfinden, wird fast nie getroffen. Watkins hat das Mobiltelefon kommen sehen. Er hat nicht gesehen, was es mit Familienabendessen, Wahlen und der Aufmerksamkeitsspanne von Kindern machen wird. Die Bilder von 1900 zeigen Fluggeräte am Himmel, aber die Menschen darunter tragen Zylinder und lange Röcke - die soziale Welt bleibt einfach stehen.

Wo das nachzulesen ist

Watkins' Originaltext erschien im Dezember 1900 unter dem Titel "What May Happen in the Next Hundred Years" im Ladies' Home Journal; das Bostoner Sammlungsarchiv und die Saturday Evening Post haben ihn 2012 erneut zugänglich gemacht und kommentiert. Die deutschen Hildebrand-Karten "Deutschland in 100 Jahren" sind als Faksimile im Bestand des Deutschen Historischen Museums Berlin und in zahlreichen kulturhistorischen Bänden über die Jahrhundertwende dokumentiert.

Wer einen breiteren Überblick sucht: Joseph J. Corn und Brian Horrigan, Yesterday's Tomorrows - Past Visions of the American Future (Smithsonian Institution Press, 1996), sammelt amerikanische Zukunftsbilder von 1880 bis 1980 und ordnet sie nach den Mustern, in denen sie systematisch trafen oder verfehlten.

Zwei

Die Künstliche Intelligenz, die seit 1956 in zehn Jahren fertig ist.

Im Sommer 1956 trafen sich am Dartmouth College in New Hampshire eine Handvoll Mathematiker und Informatiker zu einer Konferenz, die den Begriff "Artificial Intelligence" überhaupt erst prägte. In ihrem Förderantrag stand der Satz, eine Gruppe sorgfältig ausgewählter Wissenschaftler könne "erhebliche Fortschritte" bei mehreren KI-Problemen in einem einzigen Sommer machen. Zehn Jahre später formulierte Herbert Simon, einer der Pioniere, die berühmte Prognose: "Innerhalb von zwanzig Jahren werden Maschinen jede Arbeit leisten können, die ein Mensch leisten kann." Marvin Minsky am MIT sagte 1970 dem Life Magazine: in drei bis acht Jahren werde es eine Maschine mit der allgemeinen Intelligenz eines durchschnittlichen Menschen geben.

Keine dieser Vorhersagen ist eingetreten. Stattdessen folgten zwei KI-Winter in den siebziger und neunziger Jahren, in denen die Forschungsgelder einbrachen, weil die Versprechungen sich nicht eingelöst hatten. Erst nach 2012, mit dem Aufkommen tiefer neuronaler Netze, lieferte die Disziplin Ergebnisse, die einer breiten Öffentlichkeit auffielen. Auch die maschinelle Übersetzung galt 1954 nach einem ersten Demo-Erfolg in fünf Jahren als gelöst - in Wirklichkeit dauerte es rund sechzig.

Wo das nachzulesen ist

Der Dartmouth-Förderantrag von John McCarthy, Marvin Minsky, Nathaniel Rochester und Claude Shannon (1955) ist in vollem Wortlaut über das AI Magazine Vol. 27 No. 4 (2006) verfügbar. Simons Prognose findet sich in seinem Buch The Shape of Automation for Men and Management (Harper & Row, 1965), Minskys Aussage in Life Magazine, 20. November 1970, S. 58 ff.

Die Geschichte des Georgetown-IBM-Experiments von 1954 und der ALPAC-Bericht von 1966, der die maschinelle Übersetzung für eine Generation diskreditierte, sind klassisch aufgearbeitet bei John Hutchins, Machine Translation: A Concise History (City University of Hong Kong, 2007). Wer die KI-Winter im Zusammenhang verstehen will, liest Nils J. Nilsson, The Quest for Artificial Intelligence (Cambridge University Press, 2010), als ehrliche Insider-Chronik.

Drei

Der Club of Rome und die Frage, wie man "falsch" eigentlich misst.

1972 erschien Die Grenzen des Wachstums, die berühmte Studie des Club of Rome. Sie simulierte am MIT mit dem Computermodell World3 verschiedene Pfade für die Welt des 21. Jahrhunderts. Im Standardlauf kollabierte die industrielle Produktion zwischen 2020 und 2040, gefolgt von einem Einbruch der Bevölkerung. Über Jahrzehnte galt das Buch in weiten Teilen der Öffentlichkeit als widerlegt - "die Welt ist ja nicht untergegangen". Wer es heute neu liest, stellt fest: Die Autoren hatten nie 2000 oder 2010 als Krisenjahr genannt. Und Studien des australischen Physikers Graham Turner (2008, 2014) sowie eine KPMG-Aktualisierung von Gaya Herrington (2020) zeigen, dass die tatsächliche Entwicklung bei Energie, Industrieproduktion und Bevölkerung dem Business-as-usual-Pfad des Modells erstaunlich nahe gekommen ist.

Das Beispiel zeigt zweierlei: Erstens werden Prognosen oft an dem gemessen, was die Öffentlichkeit aus ihnen gemacht hat - nicht an dem, was die Autoren wirklich gesagt haben. Zweitens halten Modelle, die in Bandbreiten und Pfaden denken, statt in einer einzigen Punktprognose, der Wirklichkeit länger stand. Die seriöse Frage ist nie "war die Vorhersage richtig?", sondern "in welcher Bandbreite lag die Vorhersage, und wo darin liegt heute der tatsächliche Verlauf?"

Wo das nachzulesen ist

Originalwerk: Donella H. Meadows, Dennis Meadows, Jørgen Randers, William W. Behrens, The Limits to Growth (Universe Books, 1972; dt. Die Grenzen des Wachstums, DVA, 1972). Die Aktualisierungen liegen vor unter Limits to Growth: The 30-Year Update (2004) und 2052: A Global Forecast for the Next Forty Years (Randers, 2012).

Die Nachprüfungen: Graham Turner, "A Comparison of The Limits to Growth with 30 Years of Reality", CSIRO Working Paper, 2008, sowie sein Update bei der University of Melbourne, 2014. Gaya Herrington, "Update to Limits to Growth - Comparing the World3 Model with Empirical Data", Journal of Industrial Ecology, 2020. Beide Arbeiten kommen unabhängig zu dem Schluss, dass der Standardlauf des Modells den realen Daten der letzten Jahrzehnte gut entspricht - was nicht heißt, dass der prognostizierte Kollaps eintreten muss, aber dass die Strukturlogik des Modells nicht trivial widerlegt ist.

Vier

Die Muster, in denen Prognosen scheitern.

Wer hunderte alte Vorhersagen systematisch durchgeht, sieht ein paar Muster, die sich immer wiederholen. Das erste hat einen Namen: Amaras Gesetz, formuliert vom kalifornischen Zukunftsforscher Roy Amara in den siebziger Jahren. Es lautet: Wir überschätzen die Wirkung einer Technologie kurzfristig und unterschätzen sie langfristig. Beim Internet hat sich das 2000 in der Dotcom-Blase und 2020 in seiner tatsächlichen Allgegenwart gezeigt. Bei der KI sehen wir es gerade live.

Das zweite Muster: Diskontinuitäten werden nicht vorhergesagt. Der Mauerfall 1989, die Finanzkrise 2008, die Pandemie 2020, die plötzliche Sichtbarkeit von ChatGPT Ende 2022 - keines dieser Ereignisse stand in den seriösen Prognosen der jeweiligen Vorjahre. Was sich vorhersagen lässt, sind Trends entlang von Größen, die sich langsam und kontinuierlich bewegen (Demografie, Infrastruktur, im Bau befindliche Anlagen). Was sich nicht vorhersagen lässt, sind die Brüche, die das eigentlich Interessante ausmachen.

Das dritte Muster: Die zweite Ordnung wird übersehen. Das Auto wurde vorhergesagt - Suburbanisierung, Pendlerkultur und Klimaerwärmung wurden nicht vorhergesagt. Social Media wurde im weiteren Sinne erahnt - dass es Wahlen und Teenager umkrempelt, nicht. Wer eine Technologie sieht, sieht selten, wie die Welt sich um sie herum neu sortiert. Und dieses Sortieren ist meistens das eigentliche Ereignis.

Was die Forschung dazu sagt

Roy Amara war Präsident des Institute for the Future in Palo Alto; das nach ihm benannte Gesetz ist keine formale Theorie, sondern eine Faustregel, die sich in zahllosen Technologieverläufen wiederfindet. Eine breitere Aufarbeitung mit ähnlichem Tenor ist Carlota Perez, Technological Revolutions and Financial Capital (Edward Elgar, 2002), die zeigt, wie neue Basistechnologien (Eisenbahn, Elektrizität, Computer) regelmäßig in einem Muster aus Überschätzung, Crash und langsamer tiefer Durchdringung verlaufen.

Zur Frage, warum Diskontinuitäten so schwer vorherzusagen sind, ist Nassim Nicholas Taleb, The Black Swan (Random House, 2007), das meistgelesene Werk - mit einer scharfen Analyse, warum besonders die folgenreichsten Ereignisse genau die sind, die keiner kommen sah. Zu den Zweitordnungseffekten technischer Innovationen ist Edward Tenner, Why Things Bite Back (Knopf, 1996), nach wie vor eine gute, historisch reiche Einführung.

Fünf

Die zwanzig Jahre, in denen Tetlock 28.000 Experten gemessen hat.

Der amerikanische Psychologe Philip Tetlock hat ab Mitte der achtziger Jahre über zwanzig Jahre lang eine systematische Studie durchgeführt: 284 Experten aus Politik, Wirtschaft und Geheimdiensten gaben insgesamt knapp 28.000 konkrete Prognosen ab, die später am tatsächlichen Verlauf überprüft wurden. Sein nüchternes Ergebnis: Die durchschnittliche Experten-Prognose war kaum besser als Zufallsraten. Spezialisten in ihrem eigenen Feld waren oft schlechter als generalistisch denkende Beobachter, weil sie zu sehr an ihre eine bevorzugte Theorie glaubten.

In einer Anschlussstudie (Good Judgment Project, 2011-2015, finanziert vom amerikanischen Geheimdienst IARPA) identifizierte Tetlock eine kleine Gruppe von Menschen, die deutlich besser prognostizierten - die Superforecaster. Was sie auszeichnete, war kein Spezialwissen, sondern eine Arbeitsweise: viele Modelle gleichzeitig im Kopf halten, Prognosen in Wahrscheinlichkeiten ausdrücken statt in Gewissheiten, regelmäßig nach neuen Informationen aktualisieren, eigene Fehler dokumentieren und auswerten. Es ist eine Haltung, kein Talent.

Was die Forschung dazu sagt

Die Hauptstudie ist publiziert als Philip E. Tetlock, Expert Political Judgment: How Good Is It? How Can We Know? (Princeton University Press, 2005). Die zugängliche Aufarbeitung mit den Ergebnissen des Good Judgment Project ist Philip E. Tetlock & Dan Gardner, Superforecasting: The Art and Science of Prediction (Crown, 2015; dt. Superforecasting - Die Kunst der richtigen Prognose, S. Fischer, 2016).

Eine populärere, anekdotenreichere Variante derselben Botschaft ist Dan Gardner, Future Babble: Why Expert Predictions Are Next to Worthless (Dutton, 2010). Die methodische Grundlage - warum es überhaupt sinnvoll ist, Prognosen in Wahrscheinlichkeiten statt in Ja/Nein-Aussagen zu fassen - ist klassisch ausgearbeitet bei Daniel Kahneman, Thinking, Fast and Slow (Farrar, Straus & Giroux, 2011), insbesondere in den Kapiteln über Überkonfidenz und kalibriertes Urteilen.

Sechs

Was wir daraus für heute mitnehmen.

Wenn man hundert Jahre dokumentierter Vorhersagen sortiert, kristallisieren sich ein paar Sätze heraus, die fast immer gelten. Erstens: Punktprognosen mit Jahreszahl sind fast wertlos. "2030 wird X" ist keine Prognose, es ist eine Schlagzeile. Zweitens: Szenarien, die mehrere Pfade explizit machen, schlagen sich besser - nicht weil eines davon stimmt, sondern weil sie die Bandbreite des Möglichen ehrlich darstellen. Drittens: Kurze Horizonte (zwei bis fünf Jahre) sind brauchbar, längere driften schnell ab. Viertens: Die Dinge, die am Ende den größten Effekt haben, standen in keiner Top-10-Liste der jeweiligen Zeit.

Für die aktuelle Debatte über KI heißt das: Misstrauen gegen jede Vorhersage, die linear extrapoliert. Wer 2026 sagt, in fünf Jahren werde KI alles automatisieren, klingt wie Marvin Minsky 1970. Wer sagt, KI werde am Ende doch nichts verändern, klingt wie die Skeptiker, die das Internet nach der Dotcom-Pleite für überschätzt hielten. Beide Stimmen sind im Lichte historischer Vorhersagen unwahrscheinlich. Wahrscheinlich ist eine dritte Möglichkeit: kurzfristig weniger, als die Schlagzeilen versprechen; langfristig mehr, als die Skeptiker glauben, und in Bereichen, an die heute keiner denkt.

Praktisch gesehen ist die einzige solide Antwort auf eine unsichere Zukunft, sich nicht auf eine einzige Erzählung festzulegen. Wer heute Software, Strukturen und Verträge baut, baut sie idealerweise so, dass sie unter mehreren der plausiblen Szenarien funktionieren - und nicht nur unter einem Schönwetter-Pfad. Das ist nicht Defätismus. Das ist die einzige Form von Realismus, die hundert Jahre dokumentierter Fehlprognosen wirklich erlauben.

Worauf das hinausläuft

Die ehrlichste Antwort auf die Frage "Können wir die Zukunft vorhersagen?" ist: ein bisschen, in engen Grenzen, und nur wenn wir bereit sind, in Bandbreiten und Wahrscheinlichkeiten zu denken statt in Schlagzeilen.

Was hundert Jahre Prognose-Forensik wirklich zeigen, ist nicht, dass Vorhersagen sinnlos sind - sondern dass die Form der Vorhersage entscheidet, ob sie nützt. Wer Szenarien zeichnet, statt Punktprognosen abzugeben; wer Wahrscheinlichkeiten ausspricht, statt Gewissheiten; wer regelmäßig aktualisiert, statt an alten Vorhersagen festzuhalten - der trifft im Durchschnitt besser. Wer das umgekehrt macht, schreibt heute die Watkins-Liste von morgen.

Bei wendwerk denken wir in dieser Logik. Wir versprechen keine Software, die für die Zukunft gebaut ist - es gibt nicht die eine Zukunft. Wir bauen Systeme, die unter mehreren plausiblen Zukünften noch tragen. Das ist unspektakulär. Es ist aber das einzige, was die Geschichte der Vorhersagen wirklich rechtfertigt.

Wenn du dazu mit uns reden willst

Welche Zukunft du erwartest, entscheidet mit, was du heute baust. Und welche Form von Vorhersage du dir leistest, entscheidet, wie oft du dich täuschen wirst.

Die sechs konkreten Zukunftsszenarien, die heute ernsthaft diskutiert werden, findest du unter Wie wird die Welt 2035 aussehen?. Die Köpfe, die die globale Debatte heute prägen, unter Wohin wir gehen. Wie wir uns die Zukunft des Mittelstands konkret vorstellen, unter Wie sieht die Zukunft von Unternehmen aus?.

Lass uns reden ← Zu allen Aufsätzen

Kuratiert von Johannes Hohls für wendwerk.