In sechs Schritten mehr verstehen

Wie funktioniert maschinelles Lernen? Wir wollten es in einem Workshop genau wissen

Ein Freitagmorgen im MakerSpace, einer öffentlich zugänglichen Hightech-Werkstatt in Garching bei München. Ein Student testet einen 3-D-Drucker, der Lärm einer Bandkreissäge schallt durch den Raum. Mitarbeiter eines Unternehmens entwickeln in einem Design-Thinking-Kurs den Prototypen einer neuartigen Geldbörse. Hier im MakerSpace legen Menschen ganz praktisch Hand an die Zukunft. Oder sie versuchen es zumindest, so wie wir, die sechs Besucher des »Grundlagenworkshop Machine Learning« bei Thomas Mühlenstädt.

Der 38-Jährige arbeitet als Datenexperte bei einem Spezialisten für Funktionskleidung: Thomas Mühlenstädt scannt Daten aus Produktion oder Verkauf und sucht nach Mustern darin, nach Verbesserungsmöglichkeiten. Und wenn es die Zeit zulässt, erklärt er Menschen, was es mit maschinellem Lernen auf sich hat, mit Machine Learning. Was ist das genau? Was kann das?

1.

Es geschieht im Computer. Thomas Mühlenstädt sammelt uns am Eingang des MakerSpace ein, lotst uns vorbei am 3-D-Drucker, an den Prototypenbauern, hinein in einen Seminarraum mit Computern. Machine Learning, erste Erkenntnis, hat zunächst mal nichts mit Robotern oder Maschinen zu tun. Maschinelles Lernen geschieht im Computer. Dann wärmt Mühlenstädt den Projektor auf und wirft eine Präsentation an die Wand, in der unter anderem das Wort »Netflix« auftaucht.

2.

Es geht um das Analysieren, Verstehen und Auswerten von Nutzungsverhalten. Das amerikanische Streamingportal ist zur Konkurrenz für klassische Fernsehsender geworden. Die Macher erfassen viele Daten ihrer Nutzer und versuchen, damit ihr Portal zu verbessern: Wann brechen Zuschauer eine Serie ab? Zu welcher Uhrzeit schauen sie am liebsten? Netflix macht auf Basis dieses Wissens Vorschläge für Serien oder Filme, die nach Auswertung des Sehverhaltens für die Nutzer auch interessant sein könnten. Ein Beispiel für maschinelles Lernen.

Thomas Mühlenstädt erklärt im MakerSpace, wie der Computer beim maschinellen Lernen mit Datensätzen umgeht: Er legt eine Kurve so durch die Messpunkte, dass der aufsummierte quadratische Abstand aller Werte von der Kurve möglichst klein ist. Auf Basis dieser Funktion sagt der Computer künftige Ereignisse vorher.

3.

Wir entdecken Zusammenhänge in den Daten. Thomas Mühlenstädt zeigt nun ein Koordinatensystem, wie man es aus dem Matheunterricht kennt. Ein Pfeil zeigt nach oben und beschreibt den sogenannten Glücksindex. Ein Pfeil zeigt nach rechts und beschreibt das Pro-Kopf-Einkommen eines Landes. Im Feld zwischen beiden Pfeilen stehen Punkte. Jeder dieser Punkte beziffert den Glücksindex eines Landes in Abhängigkeit vom Pro-Kopf-Einkommen. Je höher das Pro-Kopf-Einkommen, das fällt gleich auf, desto höher der Glücksindex. Es scheint einen Zusammenhang zu geben: mehr Einkommen, mehr Glück.

4.

Der Zusammenhang zwischen Daten lässt sich mit einer Kurve beschreiben. Wir setzen uns an den Computer und öffnen das Statistikprogramm RapidMiner. Das Koordinatensystem, das Thomas Mühlenstädt eben zeigte, lässt sich auch hier darstellen. Und das ist nicht alles. RapidMiner kann eine Kurve durch die Punktewolke legen. Diese Kurve ist so errechnet, dass die Summe der quadratischen Abstände aller Punkte von dieser Kurve möglichst klein ist. Gleich noch mal, weil diese Info so wichtig ist: Die Kurve verläuft so, dass die Summe der quadratischen Abstände aller Punkte von dieser Kurve möglichst klein ist. Keine andere Kurve beschreibt den Zusammenhang zwischen Pro-Kopf-Einkommen und Glücksindex so gut. Und da wird es interessant. Diese Kurve lässt sich nämlich mit einer mathematischen Formel beschreiben. Wir können in diese Formel einen beliebigen Wert für ein Pro-Kopf-Einkommen einsetzen und bekommen dann ein Ergebnis dazu, welcher Glücksindexpunkt bei diesem Einkommen wahrscheinlich zu erwarten ist.

Wir haben nicht jedes Detail verstanden, aber wir haben das Gerüst des maschinellen Lernens gesehen.

5.

Erst erheben wir Daten. Dann sucht ein Programm mögliche Zusammenhänge zwischen diesen Daten. Dann errechnet der Computer, welche Daten künftig möglich sind. Thomas Mühlenstädt zeigt noch weitere Beispiele, die stets zu dieser Erkenntnis führen: Maschinelles Lernen bedeutet die Auswertung von Daten mit anschließender Prognose. Wir probieren das gleich aus und füttern den Computer mit Beispielen. Erst lernt er Zusammenhänge zwischen den Daten. Dann baut er sich eine Funktion, die diese Zusammenhänge beschreibt. Diese Funktion hilft ihm, eine Prognose zu treffen. Der Computer kann sich zum Beispiel pixelgenau die Beschaffenheit von Katzenbildern anschauen. Aus Position und Helligkeit der Pixel lernt er, welche Kombinationen zum Bild einer Katze führen. Er entwickelt also ein Modell für Katzenbilder. Jedes neue Bild vergleicht er mit diesem Modell. Sieht ähnlich aus? Dann könnte es eine Katze sein.

6.

Maschinelles Lernen ist die Vorhersage von Ereignissen auf der Basis vorhandener Daten. Für diese Vorhersagearbeit braucht es viel Speicherplatz und viel Rechenleistung. So erklärt sich auch, warum das autonome Fahren heute erst möglich wird: Ein autonom fahrendes Auto birgt Tausende von Sensoren, die die Umgebung überwachen. All diese Daten müssen aufgenommen, verarbeitet und schnell mit den Modellen verrechnet werden.

Als wir mit Thomas Mühlenstädt die Computer herunterfahren und auf den Tag zurückblicken, müssen wir eingestehen, dass wir nicht jedes Detail verstanden haben. Aber wir haben das Gerüst des maschinellen Lernens gesehen. Und das ist für den Anfang schon mal einiges.

Fotografie: Hannes Rohrer

Nach oben