Nimmt man uns die Maus jetzt weg?
- Stephan Waltl

- 22. Mai
- 3 Min. Lesezeit
Sie liegt seit Jahrzehnten rechts (oder links) neben deiner Tastatur. Unverändert. Treu. Manchmal kabellos, manchmal mit RGB-Beleuchtung (die niemand braucht), manchmal als Touchpad, der den Zeiger am Bildschirm bewegt, aber im Kern: dieselbe Idee wie 1968, als Douglas Engelbart sie der Welt vorstellte. Ein Holzklotz mit 2 Rädern und einem Knopf. Heute Plastik mit ein paar Tasten und einem Scrollrad.
Wir haben Quantencomputer gebaut, Smartphones entwickelt, uns via Social Media verbunden, Drohnen fliegen lassen, große Sprachmodelle trainiert, die Gedichte schreibt, bei eDonkey Filme gestohlen und Satelliten ins All geschossen, die uns sagen, wo die nächste Pizzeria ist. Aber wie wir mit unserem Rechner interagieren? Zeiger, klicken, ziehen, loslassen. Seit 50 Jahren immer das selbe!
Man muss der Maus zugestehen: Sie hat durchgehalten. Das ist schon fast respektlos gegenüber allem, was seither sonst noch so erfunden wurde.
Google will diese Art der Steuerung jetzt aber radikal ändern, auch weil sie sehen, dass immer mehr Menschen mit Computern sprechen! Google arbeitet am AI Pointer!
Die Grundidee ist einfach erklärt: Ein KI-Modell wird trainiert, physische Gesten oder kontextuelle Sprachbefehle zu interpretieren und diese direkt in Mauszeigerbewegungen zu übersetzen. Die Software greift dabei in die Steuerungsebene des Betriebssystems ein und „reimplementiert" quasi den Mauszeiger als semantisches Interface. Der Cursor hört auf, ein mechanisches Abbild unserer Handbewegungen zu sein, und wird zum Empfänger von Intentionen ("Absicht").
Das bedeutet konkret: Man zeigt auf ein Fenster und sagt „schließ das", man tippt auf einen Bereich und flüstert „vergröße das links oben" oder man beschreibt per Geste und Sprache einen Ablauf, den das System dann eigenständig ausführt. Das ist, quasi eine Art mentales Verlängerungskabel zwischen Absicht und Bildschirm und Scotty vom Raumschiff Enterprise hätte seine pure Freude damit!
Bisherige Ansätze für gestenbasierte oder sprachgesteuerte Interfaces scheiterten immer am selben Problem: Sie arbeiteten mit fixen Befehlslisten. „Sage X, es passiert Y." Wer auch nur minimal davon abwich, stand vor einer Wand. AI Pointer löst das anders: Das Modell versteht Kontext. „Schieb das da rüber" funktioniert, weil das System weiß, was „das" ist und wo „da" liegt.
Das ist kein Voice-Command mit Synonym-Erweiterung. Das ist semantisches Verstehen der Nutzerabsicht in Echtzeit.
Die Konsequenz für die Praxis:
Barrierefreiheit bekommt eine neue Dimension. Menschen mit eingeschränkter Motorik können Rechner bedienen, ohne Spezialanpassungen im System zu brauchen.
Arbeitsabläufe mit vielen repetitiven Klickpfaden werden komprimierbar. Nicht durch Automatisierungsskripte, sondern durch natürlichsprachliche Kurzanweisungen.
Der Einstieg in komplexe Software wird flacher. Wenn man nicht weiß, wo eine Funktion steckt, kann man sie beschreiben.
Soweit so lässig. Aber wer darf dem Mauszeiger befehlen, was er tut?
Wenn ein KI-Modell in die Steuerungsebene des Betriebssystems eingreift und Gesten sowie Sprachfragmente in Systemaktionen übersetzt, dann stellt sich die Frage nach Kontrolle und Transparenz ziemlich unmittelbar. Was passiert, wenn das Modell den Kontext falsch interpretiert? Ein falsch verstandener Befehl bei einer Textverarbeitung ist ärgerlich. Derselbe Fehler in einem geöffneten Buchhaltungsprogramm oder einem eMail-Client mit Zugriff auf Unternehmensdaten ist etwas anderes. Und wer sagt mir, dass ich es bin der steuert? Wäre es nicht auch denkbar, dass ein Hacker das für mich übernimmt.
Dazu kommt: Diese Modelle lernen. Was lernen sie? Aus welchen Interaktionen? Wo liegen diese Trainingsdaten? Wenn ein solches System kommerziell ausgerollt wird, was realistischerweise auf Windows, macOS oder als Browser-Plugin passieren wird, dann wird es Nutzerdaten analysieren müssen, um zu funktionieren. Gesten, Cursorbewegungen, Spracheingaben. Alles, was man am Rechner tut, wird zum Trainingsmaterial.
Das ist ungefähr so, als würde man jemandem Hausschlüssel geben und sagen: „Du darfst nur helfen, nicht neugierig sein." Vertrauenssache und das in Zeiten der strengen DSGVO!
Damit der AI Pointer ein tatsächlicher Fortschritt ist und kein weiteres Einfallstor für Big Tech in die eigene Arbeitsumgebung, braucht es 3 Dinge:
Lokale Verarbeitung: Das Modell muss on-device laufen, ohne Cloud-Verbindung für jede Geste.
Audit-Logs: Was hat das System interpretiert, was hat es ausgeführt, warum? Das muss nachvollziehbar sein.
Opt-in für alles: Keine stillen Systemeingriffe. Jede Erweiterung der Steuerungsrechte braucht explizite Zustimmung.
Ohne diese Grundbedingungen ist AI Pointer ein elegantes Konzept mit einem sehr bekannten Geschäftsmodell dahinter: Du gibst Daten, du bekommst Komfort.
Das Konzept des AI Pointers zeigt, wohin sich Mensch-Maschine-Interaktion entwickeln wird. Weg von fixen Gesten, hin zu Intention als Eingabeformat. Das ist eine spannende Richtung. Die Frage ist bloß, wer dabei wirklich am Steuer sitzt. Der Mauszeiger hat ein halbes Jahrhundert gebraucht, um vom mechanischen Abbild zur semantischen Schnittstelle zu werden. Die Frage, wem dieser neue Zeiger eigentlich gehört, wird vermutlich deutlich schneller beantwortet sein.




Kommentare