Einblick ins KI-Labor
Von Berlin aus arbeitet Slav Petrov mit KI-Spezialist:innen von Google aus aller Welt an der Entwicklung von künstlicher Intelligenz. KI-Modelle haben gelernt, über 100 Sprachen zu verstehen, Texte, Bilder, Audios und Videos zu generieren. Wie haben sie das geschafft?
Zunächst erkannte die KI die Zeichnung als Stiefel. Sie suchte im Protokoll nach einer Stelle, an der ein Stiefel – oder allgemeiner: ein Schuh – eine Rolle spielen könnte. Schließlich schlussfolgerte sie, dass mit der Zeichnung Neil Armstrongs historischer Satz »Ein kleiner Schritt für einen Menschen, aber ein riesiger Sprung für die Menschheit« gemeint sein muss. Damit abstrahierte Gemini nicht nur und schloss vom Stiefel auf den Schuh und schließlich auf Armstrongs Schritt, die KI verarbeitete auch unterschiedliche Arten von Daten: In der Frage spielte eine Zeichnung die Hauptrolle. Die Antwort lieferte ein Text.
Slav Petrov und sein Team stehen bei der Entwicklung von KI vor einer großen Herausforderung: Denn anders als wir Menschen hat KI keine Welt-Wahrnehmung. Damit sie trotzdem immer weiter dazulernt, kommt es auf das richtige Training an. Genau daran arbeiten Slav Petrov und sein Team aus KI-Spezialistinnen und Spezialisten. »Weil das Team über den ganzen Globus verstreut ist, arbeitet quasi immer jemand zu jeder beliebigen Uhrzeit«, sagt Petrov. »Das ist auch gut so – das Feld entwickelt sich wahnsinnig schnell.«
Typisches Training: Sätze vervollständigen
Um zu veranschaulichen, wie er und sein Team KI trainieren, lädt Petrov in sein Großraumbüro ein. »Quiet Area« steht draußen auf einem Schild, »Ruhezone«. Während vieles hier in der Berliner Google-Niederlassung gegenüber der Museumsinsel bunt und verspielt wirkt, ist dieser Raum auffällig nüchtern. Hier werden KI-Modelle mit besonderen Trainingsaufgaben verbessert.
»Eine typische Trainingsaufgabe besteht darin, Sätze zu vervollständigen«, erzählt Petrov. Etwa: »Spaghetti sind eine Art von ….« Nun muss die KI herausfinden, dass Spaghetti eine Art von Nudeln sind. »Wir lassen einfach Wörter aus dem Datensatz aus, und das Programm muss die fehlenden Wörter vorhersagen«, erklärt Petrov. »Das ist wichtig, damit das Programm lernen kann zu verstehen. Am Anfang rät es nach dem Zufallsprinzip, aber später trifft es recht zuverlässig.« Es braucht eine ganze Reihe von Versuchen, damit das KI-Modell hinzulernen kann – dabei lernt es sowohl Fakten als auch Grammatik, je nachdem, welches Wort man auslässt. So erfährt es zum Beispiel, dass man Spaghetti auch Nudeln oder Pasta nennen kann. Oder dass ein Stiefel auch Schuh genannt wird.
Nach und nach lernt das Programm, nicht nur einzelne Wörter, sondern Sätze zu vervollständigen und später zu übersetzen. Und schließlich kombiniert es sogar verschiedene Arten von Daten – und findet anhand einer Stiefel-Zeichnung die Stelle im Gesprächsprotokoll der Apollo-11-Mission, in der Neil Armstrong den Mond betritt.
»Unsere KI-Modelle beherrschen über 100 Sprachen und sind für Menschen auf der ganzen Welt. Deswegen bin ich so stolz darauf«
Slav Petrov, Senior Research Director
Konkret in die Praxis umgesetzt werden die Grundsätze zudem beispielsweise bei der Weiterentwicklung von Googles KI-Dienst Gemini: So können Nutzer:innen die Antwort von Gemini mit einem Klick mithilfe der Google Suche überprüfen. Dann kontrolliert das Programm, ob es im Internet Inhalte gibt, welche die Antworten belegen. Grün bedeutet: Es existieren Quellen, die diese Aussage bestätigen. Orange heißt: Es gibt Quellen mit widersprüchlichen Angaben. Dies hilft Nutzer:innen, die Antworten besser einzuordnen. Das ist wichtig, da generative KI plausibel klingende Antworten verfassen kann, die nicht immer den Tatsachen entsprechen. Das nennt man Halluzinationen. Generative KI befindet sich noch in der Anfangsphase, am Problem der Halluzinationen wird branchenübergreifend weiter geforscht.
Viele der Möglichkeiten, die Slav Petrov und sein Team erarbeiten, können auch Unternehmen in Deutschland nutzen. Denn über Google Cloud können diese mit der Technologie von Google selbst KI-Anwendungen erstellen. Für Slav Petrov ist es wichtig, KI-Technologien ständig zu verbessern, zu überprüfen und sicherzustellen, dass sie den hohen ethischen Standards der KI-Grundsätze von Google genügen. »Natürlich ist das in der Praxis aufwendig«, sagt Slav Petrov. »Aber das ist wichtig und richtig, denn wir sind überzeugt davon, dass es uns dabei hilft, KI zum Wohle der Gesellschaft weiterzuentwickeln.« Die Verantwortung von Tech-Unternehmen müsse es sein, Technologie für Menschen zugänglich und hilfreich zu machen. Dazu gehören auch alle, die kein Englisch sprechen. »Unsere KI-Modelle beherrschen über 100 Sprachen und sind für Menschen auf der ganzen Welt. Deswegen bin ich so stolz darauf.«
Fotos: Felix Brüggemann