Ga naar content

De grote lijnen: een Q&A over machine learning

Voor de meeste mensen lijkt machine learning erg futuristisch. Maar sinds kort komen we het steeds vaker tegen in ons dagelijks leven. Dat kan bijvoorbeeld een Google-computer zijn die een spelletje Go speelt of Inbox by Gmail dat automatische antwoorden verzendt. En hoewel dit allemaal heel interessant is, zijn er altijd nog mensen die zich afvragen wat machine learning nu precies is. Of wat het belang ervan is. Of waarom het herkennen van een hond in een foto minder eenvoudig is dan het klinkt. Daarom zijn we voor de grote lijnen aangeschoven bij Maya Gupta, onderzoekswetenschapper bij Google op het gebied van machine learning.

Laten we beginnen met de basis. Wat is machine learning nu precies?

Bij machine learning worden er aan de hand van een groot aantal voorbeelden patronen geïdentificeerd die de voorbeelden verklaren, om vervolgens op basis van deze patronen voorspellingen te kunnen doen over nieuwe voorbeelden.

Neem bijvoorbeeld de aanbevelingen voor films. Stel dat een miljard mensen ons vertellen wat hun tien favoriete films zijn. Deze enorme verzameling voorbeelden kan door de computer worden gebruikt om te leren wat de overeenkomsten zijn tussen de films die mensen leuk vinden. Vervolgens identificeert de computer patronen om deze voorbeelden uit te leggen, bijvoorbeeld 'Mensen die van horrorfilms houden, houden doorgaans niet van romantische films, maar wel van films met dezelfde acteurs'. Als je de computer vervolgens vertelt dat je de The Shining met Jack Nicholson leuk vond, kan deze een redelijke inschatting maken of je de romantische komedie Something’s Gotta Give met Jack Nicholson leuk zult vinden en welke andere video's op YouTube we je kunnen aanbevelen.

Ik snap het zo'n beetje. Maar hoe werkt dat in de praktijk?

In de praktijk kunnen de patronen die de machine leert, zeer complex zijn. Ze zijn vaak moeilijk in woorden uit te leggen. Neem bijvoorbeeld Google Foto's, waarmee je in je foto's naar foto's van honden kunt zoeken. Hoe doet Google dat? Eerst verzamelen we een groot aantal voorbeelden van foto's met het label 'hond' (dank aan internet!). We verzamelen ook een groot aantal foto's met het label 'kat' en foto's met ongeveer een miljoen andere labels, die ik hier maar niet allemaal zal vermelden :).

Vervolgens zoekt de computer naar pixel- en kleurpatronen die helpen bepalen of het om een kat of hond gaat (of wat dan ook). Eerst wordt er willekeurig geraden wat een goed patroon zou kunnen zijn om honden te identificeren. Vervolgens wordt er naar een voorbeeld van een afbeelding met een hond gekeken om te achterhalen of het huidige patroon werkt. Als een kat voor een hond wordt aangezien, worden er enkele kleine aanpassingen aan het gebruikte patroon gedaan. Vervolgens wordt er naar een afbeelding van een kat gekeken en worden de patronen opnieuw aangepast om te kijken of deze werken. Dit proces wordt miljoenen keren herhaald: een voorbeeld bekijken en als het voorbeeld niet goed wordt herkend, de patronen aanpassen en kijken of de desbetreffende afbeelding vervolgens wel wordt herkend.

Uiteindelijk vormen de patronen een machinaal geleerd model, zoals een diep neuraal netwerk dat honden, katten, brandweerlieden en nog veel meer zaken (meestal) goed herkent.

Dat klinkt tamelijk futuristisch. Welke andere producten van Google maken nu al gebruik van machine learning?

Google gebruikt machine learning voor een hele reeks nieuwe toepassingen. Zo kun je met Google Translate een foto van een wegwijzer of menu maken. Vervolgens analyseert Google Translate de woorden en taal op de foto om de woorden op magische wijze in realtime te vertalen naar jouw taal.

Je kunt ook van alles tegen Translate zeggen om de machinaal geleerde spraakherkenning te activeren. Spraakherkenning wordt ook in tal van andere producten gebruikt, bijvoorbeeld om je gesproken zoekopdrachten voor de Google-app te bepalen en om YouTube-video's beter zoekbaar te maken.

Je kunt je camera op borden, menu's en meer richten en meteen een vertaling krijgen. Je hebt hiervoor niet eens een internetverbinding nodig. * Word Lens is beschikbaar voor vertalingen tussen het Engels en meer dan twintig andere talen.
Je kunt met iemand praten die een andere taal spreekt.
Je kunt eenvoudig tekens en woorden schrijven die niet worden ondersteund door je toetsenbord.
Je kunt de woorden die je wilt vertalen gewoon typen.

Waarom vindt Google machine learning nu zo belangrijk?

Machine learning is geen nieuw concept en is gebaseerd op statistiekprocessen uit de 18e eeuw. Maar het klopt dat er sinds kort veel aandacht voor is. Dit heeft drie redenen.

Ten eerste hebben we een groot aantal voorbeelden nodig om computers goede voorspellingen te laten maken, zelfs met betrekking tot zaken die u en ik vrij eenvoudig vinden (bijvoorbeeld het herkennen van een hond op een foto). Met alle activiteit op internet beschikken we nu over een enorme bron aan voorbeelden waarvan computers kunnen leren. Er zijn tegenwoordig wereldwijd en in elke taal miljoenen foto's met honden op websites beschikbaar die zijn voorzien van het label 'hond'.

Maar er kan niet worden volstaan met alleen een hele reeks voorbeelden. Je kunt niet verwachten dat er iets wordt geleerd wanneer een webcam een groot aantal foto's van honden wordt getoond. De computer heeft een leerprogramma nodig. En er hebben zich de laatste tijd enkele interessante doorbraken op dit gebied (en bij Google) voorgedaan met betrekking tot de complexiteit en kracht van deze programma's voor machine learning.

Onze programma's zijn echter nog lang niet perfect en computers zijn nog redelijk dom. We moeten de grote verzameling foto's dus een groot aantal keer bekijken om de digitale knoppen af te stellen voordat iets daadwerkelijk goed wordt herkend. Dit vergt een enorme hoeveelheid rekenkracht en ingewikkelde geparallelliseerde verwerking. Maar dankzij de ontwikkeling van nieuwe software en hardware is ook dit mogelijk.

Wat kunnen computers op dit moment nog niet, maar dankzij machine learning binnenkort wel?

Het is nog maar kort geleden dat de spraakherkenningstechnologie problemen had met het herkennen van de tien cijfers van je creditcard die je via de telefoon voorlas. De ontwikkelingen op het gebied van spraakherkenning hebben de afgelopen vijf jaar een enorme vlucht genomen door het gebruik van geavanceerde technologie voor machine learning, en je kunt deze nu al gebruiken om gesproken zoekopdrachten via Google uit te voeren. En de verbeteringen volgen elkaar in hoog tempo op.

Ik denk zelfs dat machine learning ons er beter laat uitzien. Ik weet niet hoe het bij jou is, maar ik houd er niet van om kleding te passen. Als een bepaald merk spijkerbroek me goed zit, koop ik er gelijk vijf van. Maar met behulp van machine learning kunnen er op basis van de voorbeelden van merken die lekker zitten, aanbevelingen worden gedaan voor andere kleding. Dit valt niet helemaal onder de activiteiten van Google, maar ik hoop in ieder geval dat iemand anders hieraan werkt.

Hoe ziet machine learning er over tien jaar uit?

Iedereen binnen het vakgebied probeert sneller te leren op basis van minder voorbeelden. Een van de methoden om dit te realiseren (en waar Google hard aan werkt) is om onze machines meer gezond verstand te geven, wat binnen het vakgebied ook wel 'regularisatie' wordt genoemd.

Hoe ziet gezond verstand er voor een machine uit? Dit betekent in het algemeen onder andere dat wanneer een voorbeeld slechts een klein beetje verandert, de machine niet volledig van gedachten moet veranderen. Neem bijvoorbeeld een foto van een hond met een cowboyhoed. Dit blijft gewoon een hond.

We dwingen dit gezonde verstand in het leerprogramma af door de machine ongevoelig te maken voor kleine, onbelangrijke veranderingen, zoals een cowboyhoed. Dit klinkt makkelijker dan het is. Wanneer dit niet goed gebeurt, is de machine niet gevoelig genoeg voor belangrijke veranderingen. We zoeken hierin nog steeds naar de juiste balans.

Wat vind je het leukst aan machine learning? Wat motiveert je om hieraan te werken?

Ik ben opgegroeid in Seattle, waar we veel leerden over de eerste verkenners van het Amerikaanse Westen, zoals Lewis en Clark. Onderzoek naar machine learning heeft diezelfde avontuurlijke ontdekkingsgeest: ook wij zien zaken voor het eerst en proberen een weg in kaart te brengen naar een betere toekomst.

Als je machine learning bij Google moest omschrijven met een slogan, wat zou deze slogan dan zijn?

Als het de eerste keer niet lukt, probeer het dan nog een miljard keer.

Terug naar boven