Worum geht es in „Wir dachten, wir hätten noch fünfzig Jahre Zeit“?

Der Beitrag ist ein persönlicher Zeitzeugenbericht aus den Anfängen der KI-Forschung in Deutschland. Dr.-Ing. Suat Akyol blickt von seinem Einstieg 1998 an der RWTH Aachen bis zur heutigen künstlichen Intelligenz zurück und beschreibt, warum die Entwicklung viel schneller kam als erwartet.

Woran forschte Suat Akyol an der RWTH Aachen?

Am Lehrstuhl für Technische Informatik unter Professor Karl-Friedrich Kraiss arbeitete er an multimodaler Mensch-Maschine-Interaktion. Sein Schwerpunkt war die Gestenerkennung; im Umfeld lagen Mimikerkennung, Spracherkennung, Robotik, Virtual Reality und neuronale Netze.

Welche Rolle spielte BMW in dieser Forschung?

Die Forschung fand in einem Industrieprojekt mit BMW statt, das Bedienkonzepte für Fahrzeuge untersuchte. Diskutiert wurden Sprach-, Gesten- und Mimikerkennung, also Vorläufer des späteren iDrive-Konzepts. Selbst Touchscreens im Auto waren damals noch eine offene Frage.

Was war die Ausstellung „Computer.Gehirn“?

Eine Sonderausstellung des Heinz Nixdorf MuseumsForums in Paderborn. Der Lehrstuhl lieferte Exponate, darunter die Steuerung eines Informationsterminals über Gesten der Deutschen Gebärdensprache und neuronale Netze zur Objekterkennung.

Warum verließ Suat Akyol die KI-Forschung?

Nach der Promotion gab es in Deutschland kaum Karrierepfade außerhalb von Wissenschaft oder Selbstständigkeit. Er wechselte in die Industrie, zunächst zu Hella, dann zu 3M, in Management-, Vertriebs- und Transformationsfunktionen, behielt aber seine technische Denkweise bei.

Was änderte sich 2023 mit ChatGPT?

ChatGPT vermittelte erstmals das Gefühl, einer Form echter Intelligenz gegenüberzustehen. Der Fortschritt wirkte nicht evolutionär, sondern revolutionär und holte das Thema KI aus der Nische in den Alltag.

Was bedeuten Agentic AI und Claude Code in diesem Zusammenhang?

Agentenbasierte Systeme wie Claude Code beantworten nicht nur Fragen, sondern können handeln. Die KI bekommt damit gewissermaßen Hände und unterstützt heute konkrete Aufgaben in Softwareprojekten, Strategie und Analyse.

Was ist die zentrale Lektion des Artikels?

Bei der Richtung der technischen Entwicklung lag man selten falsch, bei der Geschwindigkeit dagegen oft. Die wichtigste Lehre aus drei Jahrzehnten: Man sollte vorsichtig sein, etwas für unmöglich zu erklären, denn die Zukunft kommt häufig früher, als selbst ihre Pioniere erwarten.

Wir dachten, wir hätten noch fünfzig Jahre Zeit

Collage zur Geschichte der KI-Forschung: RWTH Aachen, BMW iDrive, neuronale Netze, die Museumsausstellung Computer.Gehirn und eine Zeitachse von 1998 bis heute mit ChatGPT, Claude Code und einem humanoiden Roboter.

1998: Vom Mobilfunk zur KI-Forschung an der RWTH Aachen

Als ich 1998 mit meinem Diplom in Elektrotechnik der RWTH Aachen auf Jobsuche ging, drehte sich gefühlt alles um Mobilfunk. Auch meine Diplomarbeit hatte ich in diesem Umfeld geschrieben. Wirklich begeistert war ich davon allerdings nicht. Telefonie war eben Telefonie, jetzt halt mobil.

Das BMW-Projekt: multimodale Mensch-Maschine-Interaktion

Dann stieß ich auf eine Stellenausschreibung des Lehrstuhls für Technische Informatik der RWTH Aachen unter Professor Karl-Friedrich Kraiss. Gesucht wurde ein wissenschaftlicher Mitarbeiter für ein Industrieprojekt mit BMW. Thema war die multimodale Mensch-Maschine-Interaktion im Fahrzeug, verbunden mit der Möglichkeit zur Promotion. Das klang spannend.

Damals führte BMW gerade die ersten Versionen des späteren iDrive-Konzepts ein. Wir diskutierten Bedienkonzepte für Fahrzeuge, Spracherkennung, Gestenerkennung, Mimikerkennung und natürliche Mensch-Maschine-Interaktion. Ich beschäftigte mich mit Gestenerkennung, mein Kollege Ulrich Canzler arbeitete an Mimikerkennung, andere an Robotik, Virtual Reality oder neuronalen Netzen.

Titelseite der wissenschaftlichen Arbeit „Gestensteuerung für Fahrzeugbordsysteme“ mit den Autoren Suat Akyol, Ulrich Canzler, Klaus Bengler und Wolfgang Hahn. — Forschungsarbeit aus dem BMW-Projekt: „Gestensteuerung für Fahrzeugbordsysteme“ von Suat Akyol, Ulrich Canzler, Klaus Bengler und Wolfgang Hahn, Lehrstuhl für Technische Informatik der RWTH Aachen und BMW AG, München.

Ich erinnere mich noch an Diskussionen darüber, ob Touchscreens im Auto überhaupt sinnvoll wären. Die Sorge der BMW-Vertreter war, dass man ständig Fingerabdrücke auf dem Display sehen würde. Heute muss ich darüber schmunzeln. Damals war das eine ernsthafte Diskussion. Heute bestehen ganze Fahrzeuginnenräume aus Touchscreens.

Gestenerkennung, neuronale Netze und die Ausstellung „Computer.Gehirn“

Während meiner fünf Jahre am Lehrstuhl lieferten wir Exponate für die Sonderausstellung „Computer.Gehirn“ des Heinz Nixdorf MuseumsForums in Paderborn. Ein Exponat ermöglichte die Steuerung eines Informationsterminals durch Gesten der Deutschen Gebärdensprache. Ein anderes demonstrierte neuronale Netze zur Erkennung von Plüschtieren.

Aus heutiger Sicht klingt das unspektakulär. Damals war es faszinierend. Das neuronale Netz konnte ein Objekt erkennen, selbst wenn es anders gehalten wurde als während des Trainings. Es konnte generalisieren. Heute erkennt jede Smartphone-Kamera tausendmal komplexere Objekte. Damals war das ein Blick in die Zukunft.

Systemüberblick des Demonstrators zur Gestenerkennung für Fahrzeugbordsysteme als Diagramm. — Systemüberblick des Gestenerkennungs-Demonstrators aus derselben Arbeit: von der Bildakquisition bis zur Interpretation der Handbewegung.

Vieles von dem, was wir an Bildverarbeitung entwickelten, floss in eine quelloffene Bibliothek ein: die LTI-Lib des Lehrstuhls für Technische Informatik, eine C++-Bibliothek für Bildverarbeitung und Mustererkennung, die wir unter der GNU LGPL als Open Source freigaben. Ich gehöre zu ihren Autoren.

Wir irrten uns bei der Geschwindigkeit, nicht bei der Richtung

Und genau das ist der Punkt.

Wir hielten vieles für möglich. Wir hielten erstaunlich wenig für unmöglich. Wir haben uns lediglich bei der Geschwindigkeit geirrt.

Screenshot der BMW-Webseite zur Gestensteuerung im Fahrzeug. — Aus der Forschungsidee wurde Serientechnik: die BMW Gestensteuerung als Funktion im Fahrzeug.

Natürlich diskutierten wir damals schon darüber, ob künstliche neuronale Netze eines Tages Eigenschaften des menschlichen Gehirns nachbilden könnten. Ob man Erinnerungen speichern könnte. Ob man Persönlichkeit modellieren könnte. Ob daraus sogar etwas entstehen könnte, das man Bewusstsein nennen würde. Das waren keine Forschungsvorhaben. Das waren philosophische Diskussionen beim Kaffee. Aber sie fanden statt. Und sie erschienen uns nicht grundsätzlich unmöglich.

Was uns fehlte, war die Vorstellung davon, wie schnell sich alles entwickeln würde.

Ende der 1990er Jahre begann sich das Internet gerade erst zu verbreiten. Google wurde langsam bekannt. Die meisten Menschen hatten kein Smartphone. Viele Autos hatten kein Navigationssystem. Mobile Navigationsgeräte galten als modern. Selbstfahrende Fahrzeuge existierten als Forschungsprojekte. Virtuelle Realität erforderte große Versuchsaufbauten. Und neuronale Netze waren ein Spezialthema für wenige Experten.

Wir konnten uns vieles vorstellen. Aber wir dachten, wir hätten noch fünfzig Jahre Zeit.

Von der KI-Forschung in die Industrie

Nach meiner Promotion verließ ich die Forschung. Nicht weil ich das Thema uninteressant fand, sondern weil es kaum Möglichkeiten gab. Ein Kollege, José Pablo Alvarado Moya, der an neuronalen Netzen arbeitete, wurde Professor. Ein anderer machte sich mit seinen Entwicklungen selbstständig. Wer nicht in die Wissenschaft oder die Selbstständigkeit ging, hatte damals nur wenige Optionen. Deutschland hatte hervorragende Forscher. Aber kaum Karrierepfade.

Also wechselte ich in die Industrie. Zunächst kurz zu Hella, anschließend zu 3M. Dort machte ich Karriere in Management-, Vertriebs- und Transformationsfunktionen. Natürlich brachte ich meine technische Denkweise weiterhin ein. Daten, Modelle, Software und Digitalisierung begleiteten mich mein gesamtes Berufsleben. Den direkten Bezug zur KI verlor ich jedoch weitgehend.

In dieser Zeit beobachtete ich viele Entwicklungen, die uns damals am Lehrstuhl begeistert hätten. Die Microsoft Kinect zeigte plötzlich Gestenerkennung für den Massenmarkt. Staubsaugerroboter navigierten selbstständig durch Wohnungen und erstellten Karten ihrer Umgebung. Virtuelle Realität wurde von raumfüllenden Forschungsaufbauten zu Geräten wie der Meta Quest, die heute für wenige hundert Euro erhältlich sind. Immer wieder dachte ich: Damit hätten wir damals ganze Forschungsprojekte in einem Bruchteil der Zeit umsetzen können.

Dennoch blieb künstliche Intelligenz für die meisten Menschen ein Randthema. Auch in Unternehmen wurde zwar darüber gesprochen, aber eher als Zukunftstechnologie. Die große Welle blieb aus.

2023: ChatGPT, Claude Code und der Sprung zur Agentic AI

Bis vor wenigen Jahren.

2023 zeigte mir mein Neffe ChatGPT. Natürlich kannte ich Chatbots. Die gab es schon lange. Aber hier war etwas anders. Zum ersten Mal hatte ich das Gefühl, einer Form von echter Intelligenz gegenüberzustehen. Natürlich wusste ich als Ingenieur, dass dort kein menschliches Bewusstsein existiert. Trotzdem fühlte es sich anders an als alles, was ich zuvor gesehen hatte. Der Sprung war nicht evolutionär. Er wirkte revolutionär.

Der nächste Aha-Moment kam mit agentenbasierten Systemen wie Claude Code. Plötzlich beantwortete die KI nicht mehr nur Fragen. Sie konnte handeln. Sie bekam gewissermaßen Hände. Heute arbeite ich mit KI an Softwareprojekten, Strategien und Analysen. Gleichzeitig führe ich Gespräche über Wirtschaft, Politik, Gesellschaft und persönliche Fragestellungen.

Robotik und künstliche Intelligenz in der physischen Welt

Wenn ich heute die Fortschritte bei humanoiden Robotern sehe, erkenne ich dieselbe Dynamik. Systeme lernen zu laufen, zu greifen und mit ihrer Umgebung zu interagieren. Ob Fahrzeuge, Haushaltsgeräte, Industrieanlagen oder persönliche Assistenten, künstliche Intelligenz wird zunehmend nicht nur Informationen verarbeiten, sondern auch direkt in der physischen Welt handeln.

Die Lektion: Vorsicht mit dem Wort „unmöglich“

Wenn ich auf die letzten dreißig Jahre zurückblicke, stelle ich fest: Wir haben uns selten bei der Richtung geirrt. Wir haben uns bei der Geschwindigkeit geirrt.

Navigationssysteme. Sprachassistenten. Virtuelle Realität. Autonome Systeme. Künstliche Intelligenz. Fast alles, was wir damals für grundsätzlich möglich hielten, ist Realität geworden. Manches kam später als gedacht. Vieles kam anders als gedacht. Einige Dinge stehen noch aus. Aber erstaunlich wenig erwies sich als unmöglich.

Wenn ich meinem jüngeren Ich im Jahr 2003 eine Nachricht schicken könnte, würde sie vermutlich lauten:

„Bleib auf diesem Gebiet. Es wird real.“

Heute, fast dreißig Jahre nach meinem Einstieg in die KI-Forschung, überrascht mich weniger die Existenz künstlicher Intelligenz. Mich überrascht, dass sie bereits da ist.

Und dass selbst diejenigen von uns, die damals an diesen Themen gearbeitet haben, nicht damit gerechnet hätten, wie schnell sie plötzlich Teil unseres Alltags werden würde.

Vielleicht ist das die wichtigste Lektion aus den letzten drei Jahrzehnten:

Man sollte vorsichtig sein, etwas für unmöglich zu erklären.

Die Geschichte zeigt, dass die Zukunft oft früher kommt, als selbst ihre Pioniere erwarten.