Direkt zum Inhalt

Einfach erklärt: Fragen und Antworten zum maschinellen Lernen

Für viele von uns ist maschinelles Lernen noch eine futuristische Vision. Seit Kurzem ist es aber auch immer häufiger in unserem alltäglichen Leben anzutreffen – ob in Form eines Google-Computers, der eine beeindruckende Partie Go spielt, oder durch die automatischen Antworten von Inbox by Gmail. Das ist zwar alles spannend, doch einige von uns fragen sich noch immer, was genau maschinelles Lernen ist. Oder warum es wichtig ist. Oder warum das Erkennen eines Hundes auf einem Foto nicht so einfach ist, wie es klingt. Deshalb haben wir uns mit Maya Gupta, einer wissenschaftlichen Mitarbeiterin bei Google, unterhalten, um uns das näher anzusehen.

Beginnen wir mit den Grundlagen. Was genau ist maschinelles Lernen?

Maschinelles Lernen nimmt zahlreiche Beispiele, ermittelt Muster, die diese Beispiele erklären, und verwendet dann diese Muster, um Vorhersagen über neue Beispiele zu treffen.

Ein Beispiel wären Filmempfehlungen. Nehmen wir an, eine Milliarde Menschen verraten uns ihre zehn Lieblingsfilme. Das sind ganz schön viele Beispiele, die der Computer verwenden kann, um herauszufinden, welche Gemeinsamkeiten diese Filme haben. Dann erstellt der Computer Muster zur Erklärung dieser Beispiele, wie beispielsweise: "Menschen, die Horrorfilme mögen, mögen normalerweise keine Liebesfilme, aber Menschen mögen Filme, in denen dieselben Schauspieler vorkommen." Wenn Sie dann dem Computer sagen, dass Ihnen "The Shining" mit Jack Nicholson gefallen hat, kann er die Vermutung anstellen, dass Sie auch die romantische Komödie "Was das Herz begehrt" mit Jack Nicholson mögen, und Ihnen entsprechende Videos auf YouTube empfehlen.

Ich verstehe. Zumindest so ungefähr. Aber wie funktioniert das in der Praxis?

In der Praxis sind die Muster, die der Computer lernt, sehr kompliziert und schwer zu erklären. Denken Sie an Google Fotos. Damit können Sie Ihre Fotos durchsuchen, um Bilder mit Hunden zu finden. Wie macht Google das? Also, zunächst einmal bekommen wir – Internet sei Dank – unzählige Fotos mit der Bezeichnung "Hund". Wir erhalten auch etliche Fotos mit der Bezeichnung "Katze" und Fotos mit unzähligen anderen Bezeichnungen, die ich hier aber nicht alle aufzählen werde :).

Dann sucht der Computer nach Mustern von Pixeln und Farben, um so herauszufinden, ob es sich um eine Katze oder einen Hund oder etwas anderes handelt. Zunächst wird nur eine vage Vermutung aufgestellt, welche Muster sich gut zur Erkennung von Hunden eignen könnten. Dann sieht sich der Computer ein Beispiel eines Hundebildes an und beurteilt, ob seine aktuellen Muster darauf zutreffen. Wenn er versehentlich eine Katze für einen Hund hält, passt er die verwendeten Muster ein klein wenig an. Dann sieht er sich ein Katzenbild an und optimiert wieder seine Muster, um auf die richtige Antwort zu kommen. Und das wiederholt er etwa eine Milliarde Mal: ein Beispiel anschauen, und wenn er sich irrt, die verwendeten Muster optimieren, um dieses eine Beispiel besser hinzukriegen.

Am Ende bilden die Muster ein maschinell erlerntes Modell, ähnlich einem neuronalen Deep-Learning-Netzwerk, das Hunde, Katzen, Feuerwehrleute und viele, viele andere Dinge (meist) korrekt erkennen kann.

Das klingt ziemlich futuristisch. Welche anderen Google-Produkte machen sich maschinelles Lernen bereits zunutze?

Es gibt eine ganze Reihe neuer Dinge, bei denen Google maschinelles Lernen einsetzt. So kann Google Übersetzer ein Foto von einem Strassenschild oder einer Speisekarte in einer Sprache aufnehmen, erkennen, welche Wörter und Sprache im Foto zu sehen sind, und sie auf magische Weise in Echtzeit in Ihre Sprache übersetzen.

Sie können Google Übersetzer auch so gut wie alles sagen, und schon startet die maschinell gelernte Spracherkennung. Die Spracherkennung wird auch in vielen anderen Produkten verwendet, etwa um Ihre Sprachsuche in der Google App zu verarbeiten und um YouTube-Videos leichter auffindbar zu machen.

Richten Sie einfach Ihre Kamera auf Schilder, Speisekarten und mehr und schon erhalten Sie eine Übersetzung. Dafür ist noch nicht einmal eine Internetverbindung notwendig. * Word Lens ist in Englisch und mehr als zwei Dutzend anderen Sprachen verfügbar.
Sie können mit jemandem sprechen, der eine andere Sprache spricht.
Sie können mühelos Buchstaben und Wörter mit der Hand schreiben, die nicht von Ihrer Tastatur unterstützt werden.
Tippen Sie einfach die Wörter ein, die Sie übersetzen möchten.

Warum ist maschinelles Lernen für Google gerade jetzt ein so zentrales Thema?

Maschinelles Lernen ist nicht ganz neu und hat seine Wurzeln im 18. Jahrhundert. Aber Sie haben recht, dass das Thema gerade in letzter Zeit an Interesse gewonnen hat. Dafür gibt es drei Gründe.

Erstens benötigen wir eine grosse Anzahl von Beispielen, um Computern beizubringen, wie man gute Vorhersagen trifft – selbst über Dinge, die für Sie oder mich einfach wären, wie etwa einen Hund auf einem Foto erkennen. Mit all den Aktivitäten im Internet haben wir jetzt eine reichhaltige Quelle für Beispiele, von denen Computer lernen können. Beispielsweise gibt es auf Websites auf der ganzen Welt Millionen von Hundefotos mit der Bezeichnung "Hund" in jeder Sprache.

Aber es reicht nicht, zahlreiche Beispiele zu haben. Sie können nicht einfach ein paar Fotos von Hunden einer Webcam zeigen und erwarten, dass sie etwas lernt. Der Computer benötigt ein Lernprogramm. Und kürzlich erzielte die Branche – und Google – einige beeindruckende Durchbrüche dabei, wie komplex und leistungsfähig diese maschinellen Lernprogramme sein können.

Allerdings sind unsere Programme noch nicht perfekt, und Computer sind immer noch ziemlich einfältig. Deshalb müssen wir eine grosse Menge von Beispielen mehrfach sehen, um zahlreiche digitale Regler zu optimieren und ein korrektes Ergebnis zu erzielen. Dies alles erfordert eine enorme Rechenleistung und komplizierte parallele Verarbeitung. Aber neue Fortschritte bei Software und Hardware haben auch das ermöglicht.

Was können Computer heute noch nicht, werden es aber dank des maschinellen Lernens schon bald können?

Praktisch gestern hatte die Spracherkennung noch damit zu kämpfen, nur zehn verschiedene Ziffern zu erkennen, wenn Sie Ihre Kreditkartennummer am Telefon vorlasen. Die Spracherkennung hat in den letzten fünf Jahren durch ausgefeilte Methoden des maschinellen Lernens unglaubliche Fortschritte erzielt. Heute können Sie damit Google-Suchanfragen durchführen. Und all das wird immer besser, und zwar in einem rasanten Tempo.

Ich denke, maschinelles Lernen wird uns sogar dabei helfen, besser auszusehen. Ich weiss nicht, wie es Ihnen geht, aber ich hasse es, Kleidung anzuprobieren! Wenn ich eine Jeansmarke finde, die mir passt, kaufe ich gleich fünf Stück davon. Aber maschinelles Lernen kann die Marken, die uns stehen, als Beispiele verwenden, um Empfehlungen darüber abzugeben, was uns sonst noch passen könnte. Diese Thematik liegt nicht ganz auf der Linie von Google, aber ich hoffe, dass jemand an einer solchen Anwendung arbeitet!

Wie sieht das maschinelle Lernen in zehn Jahren aus?

Die gesamte Branche arbeitet daran, wie Computer aus weniger Beispielen schneller lernen können. Ein Ansatz, der von Google besonders intensiv verfolgt wird, ist, unseren Maschinen mehr gesunden Menschenverstand zu verleihen. In der Branche wird dies "Regularisierung" genannt.

Wie sieht gesunder Menschenverstand bei einer Maschine aus? Es bedeutet etwa, dass, wenn sich ein Beispiel nur geringfügig ändert, die Maschine nicht komplett ihre Meinung ändern sollte. Zum Beispiel ist ein Foto von einem Hund mit einem Cowboyhut noch immer ein Hund.

Wir setzen diese Art von gesundem Menschenverstand im Lernprogramm um, indem wir die Maschine unempfindlich gegenüber kleinen, unwesentlichen Veränderungen machen, wie einem Cowboyhut. Das klingt zwar einfach. Doch wenn das nicht klappt, macht man die Maschine gegenüber wichtigen Änderungen nicht empfindlich genug. Daher ist dies ein Balanceakt, an dem wir noch arbeiten.

Was reizt Sie am maschinellen Lernen am meisten? Was motiviert Sie, daran zu arbeiten?

Ich bin in Seattle aufgewachsen, wo wir viel über die frühen Entdecker des amerikanischen Westens wie Lewis und Clark gelernt haben. Die Arbeiten zum maschinellen Lernen basieren auf demselben Forschergeist – wir sehen Dinge zum ersten Mal und versuchen, einen Weg in eine bessere Zukunft zu finden.

Wenn Sie dem maschinellen Lernen bei Google einen Slogan geben könnten, wie würde der lauten?

Versuch macht klug – 1 Milliarde Versuche machen klüger.

Nach oben