Artificial Intelligence bij Jumbo

Twee studenten Toegepaste Wiskunde vertellen over hun projecten bij

Sfeerafbeelding Fontys

Naast dat medewerkers van Fontys onderzoek doen naar AI, doen studenten van Fontys natuurlijk ook projecten die alles te maken hebben met artificial intelligence en machine learning. Zo deden Max (20) en Evert (24) als derdejaars studenten Toegepaste Wiskunde gezamenlijk twee projecten bij Jumbo Supermarkten. De twee hadden beide een passie voor wiskunde waardoor ze vol enthousiasme begonnen aan hun stage bij Jumbo, vlak nadat ze de pre-master Data Science hadden afgerond om na de hbo-opleiding door te stromen naar de universiteit. Dat enthousiasme brachten ze ook over tijdens het vertellen over hun projecten.

Het eerste project dat ze deden was gericht op wanbetalers van online boodschappen. Er bleken  mensen bestellingen te plaatsen, die uiteindelijk niet betaald werden. Door middel van artificial intelligence probeerden de jongens een risico uit te drukken of een klant wel of niet zou betalen. Maar hoe doen ze dat dan? Met een hoop verzamelde data, zowel intern als extern, draaien de jongens analyses door middel van algoritmes uit te voeren. Deze algoritmes leren zelf verbanden te herkennen in de data. “Wanneer je een sloot data in zo’n algoritme gooit, dan herkent dat algoritme wat en wanneer er iets gebeurt,” aldus Max. Om te controleren of die voorspellingen kloppen, houden ze een klein beetje data uit de beschikbare data apart. Daarmee konden ze checken of de voorspellingen uit hun algoritme juist waren. Hoewel het model niet één-op-één werd overgenomen door Jumbo, was het eerste project toch succesvol: “Achteraf bleek dat de data die we hadden minder betrouwbaar was en met minder betrouwbare data krijg je onbetrouwbare antwoorden, maar de verbanden die we gemaakt hadden waren wel degelijk relevant,” legt Evert uit.

De tweede opdracht ging stukken beter. Wederom voor de online afdeling van Jumbo onderzochten de twee jongens of ze een tool konden maken waarmee de beslissing om een postcodegebied aan het bezorggebied toe te voegen een juiste was. Door middel van interne en externe data konden zij analyses uitvoeren, die uiteindelijk voorspellen hoeveel bestellingen er in een postcodegebied gedaan zou worden. De heren mochten uiteraard niet alle geheimen van Jumbo verklappen, maar konden een klein tipje van de sluier lichten over wat voor data er zoal in het algoritme verwerkt wordt. Dat kan bijvoorbeeld zijn het aantal inwoners in een postcodegebied, maar ook interne data als hoe goed loopt een lokale Jumbo. Daarbij worden nog een stuk of 50 andere voorspellende variabelen gebruikt. Daartussen zoekt de machine dan verbanden. Bijvoorbeeld wanneer er x aantal bewoners in een gebied wonen, de lokale Jumbo draait y aan omzet, dan zullen er z online bestellingen gedaan worden. Welke cijfers er dan in het algoritme worden gebruikt, bepalen de mannen in principe zelf: “Je gebruikt cijfers waarvan je denkt dat die sterk met elkaar samenhangen, dat gooi je dan in het systeem en die zoekt het allemaal uit. De toegevoegde waarde van ons als wiskundigen is dat wij weten hoe het systeem gaat reageren op bepaalde instellingen,” aldus Max. De uitkomsten van het algoritme hebben de heren verwerkt in een dashboard. Evert legt uit: “Heel simplistisch hebben we de kaart van Nederland opgedeeld in 4000 postcodegebieden en wanneer iemand met zijn muis een gebied selecteert, zie je het verwachte aantal bestellingen per week van dat gebied met daarnaast een korte onderbouwing.” Je zou denken, die jongens zijn hier maanden mee bezig geweest, maar niets is minder waar. In slechts 240 uur per persoon hebben ze hun plan opgezet, uitgevoerd en geanalyseerd. Die 240 uur zijn verdeeld in taken als de data opschonen. Hierbij wordt er gezocht naar onregelmatigheden in de data; wanneer er bijvoorbeeld ergens 8 staat en op een andere plek acht, interpreteert het algoritme dit als twee verschillende dingen. Wat uiteindelijk wel belangrijk is om te vermelden, is dat een stukje computer is die de analyse doet en dat is geen menselijk brein. Een mens maakt uiteindelijk nog wel de beslissing of dat postcodegebied toe wordt gevoegd. Want in bijvoorbeeld Groningen zit geen centraal punt van Jumbo, ook al is een postcodegebied daar super goed, dan is het niet perse handig om daar te gaan bezorgen.

Hoe gedreven de jongens zijn blijkt wel uit hun vasthoudendheid: ondanks dat hun stage is afgelopen, blijven ze doorgaan met de validatie van hun model. Validatie is, naast het opschonen van de data, namelijk ontzettend belangrijk. En dus gaan de jongens nog door met een tweede validatie. Wat de uitkomsten daarvan zijn, horen we hopelijk later nog.