Algoritme UT-student voorspelt ‘De Mol’

| Stan Waning

Liefhebbers van het AVROTROS-programma ‘Wie is de Mol’ leven vaak weken in spanning naar het moment toe dat dé mol bekend wordt gemaakt. UT-student Haico Dorenbos is er na zes weken al zeker van door zijn eigen bedachte algoritme ‘Moldel’. En dat terwijl hij niet eens groot fan is.

Haico Dorenbos.

Dorenbos is masterstudent Computer Science aan de UT. Die studie kwam hem goed van pas in de ontwikkeling van zijn eigen algoritme, dat is opgebouwd uit vijf onderdelen. In februari 2019 bedacht hij zijn plan, toen acteur Rick Paul van Mullingen afviel in het programma, terwijl Dorenbos zeker wist dat hij de mol was dat seizoen. Die fout wilde de Brabander niet weer maken.

Is je ‘Moldel’ waterdicht?

Dorenbos: ‘Ik denk het wel. Aan het begin van het seizoen uiteraard nog niet. Dan schommelt het model, omdat er nog veel kandidaten in het spel zitten en omdat er nog te weinig data is. Na aflevering 6 of 7 durf ik een voorspelling aan. Van seizoen 9 tot en met het Renaissance-seizoen (jubileum na seizoen 20, red.) heeft het model in de finales altijd gelijk gehad. In de halve finales zat het model één keer mis. Dat is een goede score.’

Is het voor jou nog wel leuk om het programma te kijken?

‘Dit maakt het voor mij alleen maar leuker. Ik ben nooit echt een grote fan van het programma geweest, maar nu is het veel spannender. Ik kijk natuurlijk niet als een normale liefhebber, maar de spanning zit voor mij in het moldel. Ik wil dat het betrouwbaar blijft.’

Spreek je vrienden die fan zijn van het programma nog wel?

‘Zeker, die vinden het juist alleen maar leuk. Ik heb wel een paar vrienden die fan zijn van het programma en dus niet voortijdig willen weten wie de mol is, maar dat doe ik dan ook niet.’

Welke rol speelde de UT in dit project?

‘Ik werkte het idee grotendeels op de campus uit. Op een gegeven moment ging het zo lopen dat er ook veel vrije tijd in ging zitten. Ik heb alles teruggekeken tot en met seizoen 9. De seizoenen daarvoor zijn eigenlijk niet te doen, door de cast en de manier waarop er toen gefilmd werd. Ik heb gevraagd of ik het algoritme mag gebruiken als eindproject voor mijn master en dat is goedgekeurd.’

Is het algoritme af?

‘Nee, ik wil het nog verder finetunen. Het kan altijd beter. Ik wil meer lagen gaan toevoegen bijvoorbeeld.’

Spoiler alert: het moldel is er voor dit seizoen nog niet uit? 

‘Dat klopt inderdaad. Het lijkt erop dat Marije of Splinter de mol is. Marije gaat aan de leiding, omdat Splinter eigenlijk te veel in beeld is om de mol te zijn. Op seizoen 16 na, toen Klaas de mol was, gebeurt dat eigenlijk vrijwel nooit.’

Het Renaissance-seizoen was het makkelijkste ooit?

‘Dat is niet helemaal waar. Tijdens het seizoen schommelde het moldel behoorlijk. In de finale durfde ik inderdaad mijn hand in het vuur te steken voor Jeroen (Kijk in de Vegte, red.). Nikkie (De Jager, red.) viel tijdens de executie in de eerste aflevering eigenlijk al af en ze was te veel in beeld.’

Had je verwacht dat er zoveel media-aandacht voor je moldel zou zijn?

‘Ik had wel verwacht dat het zou gaan leven, maar niet in zo’n extreme vorm. Ik ben op Q-Music en op Radio 538 geweest en De Telegraaf, het AD, Powned, RTL Nieuws en regionale media hebben aandacht aan het onderwerp besteed. Dinsdag heb ik alleen maar interviews gegeven. Het geeft aan dat mensen het moldel interessant vinden, maar laat ook zien hoeveel mensen Wie is de Mol volgen.’

'Moldel'

  • De Exam Drop layer kijkt hoe afvallers hun zichtbare vragen beantwoorden. Deze layer probeert te voorspellen hoe groot de kans is dat de kandidaten deze vragen goed hebben beantwoord. Eerdere afvallers hebben vaak een grotere kans dan latere afvallers om hun vraag fout te beantwoorden, en vraag 20 'Wie is de Mol?' wordt bijvoorbeeld vaker fout beantwoord dan vraag 1 'Is de Mol een man of een vrouw?'.⠀⠀
  • De Exam Pass layer probeert aan de hand van hoeveel jokers/vrijstellingen gebruikt worden, te voorspellen wie de mol is. Als iemand de finale bereikt zonder veel jokers/vrijstellingen te gebruiken, is het waarschijnlijker dat die speler de mol is dan spelers die de finale bereiken door veel jokers/vrijstellingen te gebruiken.⠀⠀
  • De Wikipedia layer kijkt naar de Wikipediapagina's van spelers en probeert op basis van Natural Language Processing (een techniek die gebruikt wordt om slimme algoritmes onze taal te laten begrijpen) karaktereigenschappen van spelers te analyseren. Denk aan beroep en bekendheid. Deze layer wordt getraind met Wikipediapagina's van oud-mollen.⠀⠀
  • De Appearance layer kijkt naar hoe vaak spelers in beeld komen tijdens de aflevering door middel van een gezichtsherkenningstool. De mol blijkt namelijk significant minder in beeld te komen tijdens de eerste vijf afleveringen.⠀⠀
  • De Social Media layer sluit spelers uit als Mol als ze te vroeg actief zijn op social media tijdens de opnameperiode. De layer kijkt ook naar ander bewijs dat aantoont dat ze niet aanwezig waren bij de gehele opname periode.⠀⠀⠀⠀

Stay tuned

Sign up for our weekly newsletter.