1998: Vom Mobilfunk zur KI-Forschung an der RWTH Aachen
Als ich 1998 mit meinem Diplom in Elektrotechnik der RWTH Aachen auf Jobsuche ging, drehte sich gefühlt alles um Mobilfunk. Auch meine Diplomarbeit hatte ich in diesem Umfeld geschrieben. Wirklich begeistert war ich davon allerdings nicht. Telefonie war eben Telefonie, jetzt halt mobil.
Das BMW-Projekt: multimodale Mensch-Maschine-Interaktion
Dann stieß ich auf eine Stellenausschreibung des Lehrstuhls für Technische Informatik der RWTH Aachen unter Professor Karl-Friedrich Kraiss. Gesucht wurde ein wissenschaftlicher Mitarbeiter für ein Industrieprojekt mit BMW. Thema war die multimodale Mensch-Maschine-Interaktion im Fahrzeug, verbunden mit der Möglichkeit zur Promotion. Das klang spannend.
Damals führte BMW gerade die ersten Versionen des späteren iDrive-Konzepts ein. Wir diskutierten Bedienkonzepte für Fahrzeuge, Spracherkennung, Gestenerkennung, Mimikerkennung und natürliche Mensch-Maschine-Interaktion. Ich beschäftigte mich mit Gestenerkennung, mein Kollege Ulrich Canzler arbeitete an Mimikerkennung, andere an Robotik, Virtual Reality oder neuronalen Netzen.
Ich erinnere mich noch an Diskussionen darüber, ob Touchscreens im Auto überhaupt sinnvoll wären. Die Sorge der BMW-Vertreter war, dass man ständig Fingerabdrücke auf dem Display sehen würde. Heute muss ich darüber schmunzeln. Damals war das eine ernsthafte Diskussion. Heute bestehen ganze Fahrzeuginnenräume aus Touchscreens.
Gestenerkennung, neuronale Netze und die Ausstellung „Computer.Gehirn“
Während meiner fünf Jahre am Lehrstuhl lieferten wir Exponate für die Sonderausstellung „Computer.Gehirn“ des Heinz Nixdorf MuseumsForums in Paderborn. Ein Exponat ermöglichte die Steuerung eines Informationsterminals durch Gesten der Deutschen Gebärdensprache. Ein anderes demonstrierte neuronale Netze zur Erkennung von Plüschtieren.
Aus heutiger Sicht klingt das unspektakulär. Damals war es faszinierend. Das neuronale Netz konnte ein Objekt erkennen, selbst wenn es anders gehalten wurde als während des Trainings. Es konnte generalisieren. Heute erkennt jede Smartphone-Kamera tausendmal komplexere Objekte. Damals war das ein Blick in die Zukunft.
Vieles von dem, was wir an Bildverarbeitung entwickelten, floss in eine quelloffene Bibliothek ein: die LTI-Lib des Lehrstuhls für Technische Informatik, eine C++-Bibliothek für Bildverarbeitung und Mustererkennung, die wir unter der GNU LGPL als Open Source freigaben. Ich gehöre zu ihren Autoren.
Wir irrten uns bei der Geschwindigkeit, nicht bei der Richtung
Und genau das ist der Punkt.
Wir hielten vieles für möglich. Wir hielten erstaunlich wenig für unmöglich. Wir haben uns lediglich bei der Geschwindigkeit geirrt.
Natürlich diskutierten wir damals schon darüber, ob künstliche neuronale Netze eines Tages Eigenschaften des menschlichen Gehirns nachbilden könnten. Ob man Erinnerungen speichern könnte. Ob man Persönlichkeit modellieren könnte. Ob daraus sogar etwas entstehen könnte, das man Bewusstsein nennen würde. Das waren keine Forschungsvorhaben. Das waren philosophische Diskussionen beim Kaffee. Aber sie fanden statt. Und sie erschienen uns nicht grundsätzlich unmöglich.
Was uns fehlte, war die Vorstellung davon, wie schnell sich alles entwickeln würde.
Ende der 1990er Jahre begann sich das Internet gerade erst zu verbreiten. Google wurde langsam bekannt. Die meisten Menschen hatten kein Smartphone. Viele Autos hatten kein Navigationssystem. Mobile Navigationsgeräte galten als modern. Selbstfahrende Fahrzeuge existierten als Forschungsprojekte. Virtuelle Realität erforderte große Versuchsaufbauten. Und neuronale Netze waren ein Spezialthema für wenige Experten.
Wir konnten uns vieles vorstellen. Aber wir dachten, wir hätten noch fünfzig Jahre Zeit.
Von der KI-Forschung in die Industrie
Nach meiner Promotion verließ ich die Forschung. Nicht weil ich das Thema uninteressant fand, sondern weil es kaum Möglichkeiten gab. Ein Kollege, José Pablo Alvarado Moya, der an neuronalen Netzen arbeitete, wurde Professor. Ein anderer machte sich mit seinen Entwicklungen selbstständig. Wer nicht in die Wissenschaft oder die Selbstständigkeit ging, hatte damals nur wenige Optionen. Deutschland hatte hervorragende Forscher. Aber kaum Karrierepfade.
Also wechselte ich in die Industrie. Zunächst kurz zu Hella, anschließend zu 3M. Dort machte ich Karriere in Management-, Vertriebs- und Transformationsfunktionen. Natürlich brachte ich meine technische Denkweise weiterhin ein. Daten, Modelle, Software und Digitalisierung begleiteten mich mein gesamtes Berufsleben. Den direkten Bezug zur KI verlor ich jedoch weitgehend.
In dieser Zeit beobachtete ich viele Entwicklungen, die uns damals am Lehrstuhl begeistert hätten. Die Microsoft Kinect zeigte plötzlich Gestenerkennung für den Massenmarkt. Staubsaugerroboter navigierten selbstständig durch Wohnungen und erstellten Karten ihrer Umgebung. Virtuelle Realität wurde von raumfüllenden Forschungsaufbauten zu Geräten wie der Meta Quest, die heute für wenige hundert Euro erhältlich sind. Immer wieder dachte ich: Damit hätten wir damals ganze Forschungsprojekte in einem Bruchteil der Zeit umsetzen können.
Dennoch blieb künstliche Intelligenz für die meisten Menschen ein Randthema. Auch in Unternehmen wurde zwar darüber gesprochen, aber eher als Zukunftstechnologie. Die große Welle blieb aus.
2023: ChatGPT, Claude Code und der Sprung zur Agentic AI
Bis vor wenigen Jahren.
2023 zeigte mir mein Neffe ChatGPT. Natürlich kannte ich Chatbots. Die gab es schon lange. Aber hier war etwas anders. Zum ersten Mal hatte ich das Gefühl, einer Form von echter Intelligenz gegenüberzustehen. Natürlich wusste ich als Ingenieur, dass dort kein menschliches Bewusstsein existiert. Trotzdem fühlte es sich anders an als alles, was ich zuvor gesehen hatte. Der Sprung war nicht evolutionär. Er wirkte revolutionär.
Der nächste Aha-Moment kam mit agentenbasierten Systemen wie Claude Code. Plötzlich beantwortete die KI nicht mehr nur Fragen. Sie konnte handeln. Sie bekam gewissermaßen Hände. Heute arbeite ich mit KI an Softwareprojekten, Strategien und Analysen. Gleichzeitig führe ich Gespräche über Wirtschaft, Politik, Gesellschaft und persönliche Fragestellungen.
Robotik und künstliche Intelligenz in der physischen Welt
Wenn ich heute die Fortschritte bei humanoiden Robotern sehe, erkenne ich dieselbe Dynamik. Systeme lernen zu laufen, zu greifen und mit ihrer Umgebung zu interagieren. Ob Fahrzeuge, Haushaltsgeräte, Industrieanlagen oder persönliche Assistenten, künstliche Intelligenz wird zunehmend nicht nur Informationen verarbeiten, sondern auch direkt in der physischen Welt handeln.
Die Lektion: Vorsicht mit dem Wort „unmöglich“
Wenn ich auf die letzten dreißig Jahre zurückblicke, stelle ich fest: Wir haben uns selten bei der Richtung geirrt. Wir haben uns bei der Geschwindigkeit geirrt.
Navigationssysteme. Sprachassistenten. Virtuelle Realität. Autonome Systeme. Künstliche Intelligenz. Fast alles, was wir damals für grundsätzlich möglich hielten, ist Realität geworden. Manches kam später als gedacht. Vieles kam anders als gedacht. Einige Dinge stehen noch aus. Aber erstaunlich wenig erwies sich als unmöglich.
Wenn ich meinem jüngeren Ich im Jahr 2003 eine Nachricht schicken könnte, würde sie vermutlich lauten:
„Bleib auf diesem Gebiet. Es wird real.“
Heute, fast dreißig Jahre nach meinem Einstieg in die KI-Forschung, überrascht mich weniger die Existenz künstlicher Intelligenz. Mich überrascht, dass sie bereits da ist.
Und dass selbst diejenigen von uns, die damals an diesen Themen gearbeitet haben, nicht damit gerechnet hätten, wie schnell sie plötzlich Teil unseres Alltags werden würde.
Vielleicht ist das die wichtigste Lektion aus den letzten drei Jahrzehnten:
Man sollte vorsichtig sein, etwas für unmöglich zu erklären.
Die Geschichte zeigt, dass die Zukunft oft früher kommt, als selbst ihre Pioniere erwarten.