Home » Artikel » Je Eigen Datagedreven Voetbalwedden Model Bouwen

Je Eigen Datagedreven Voetbalwedden Model Bouwen

Een beeld van een laptop en een notitieboekje op een lijst

Laden...

Er komt een moment in de ontwikkeling van elke serieuze wedder waarop het lezen van andermans analyses niet meer volstaat. Je wilt je eigen inschatting maken, onafhankelijk van tipgevers, zonder te leunen op het oordeel van anderen. De logische volgende stap is het bouwen van een eigen voorspellingsmodel: een systematische methode om wedstrijden te analyseren en kansen in te schatten die je kunt vergelijken met de quoteringen van bookmakers.

Dat klinkt als iets voor wiskundigen en programmeurs, maar de basisversie van een werkend model kan iedereen bouwen met een spreadsheet en openbaar beschikbare data. Dit artikel laat zien hoe je begint, welke data je nodig hebt en hoe je je model toetst aan de werkelijkheid.

Waarom een Eigen Voetbalwedden Model Helpt

De reden om een eigen model te bouwen is niet dat je slimmer bent dan de bookmaker. Bookmakers hebben teams van analisten, toegang tot exclusieve data en algoritmes die verfijnd zijn over jaren van ontwikkeling. Je gaat ze niet verslaan met een spreadsheet. Maar dat hoeft ook niet.

Het doel van een eigen model is om een onafhankelijk referentiepunt te hebben. Wanneer je een wedstrijd analyseert, heb je nu een eigen kansinschatting die je naast die van de bookmaker kunt leggen. Als jouw model een thuiswinst op 60 procent inschat en de bookmaker biedt een quotering van 2.10, wat overeenkomt met 48 procent, dan signaleert dat een mogelijke discrepantie die de moeite waard is om verder te onderzoeken.

Een eigen model dwingt je bovendien tot gedisciplineerde analyse. In plaats van op gevoel te beslissen, dwing je jezelf om elke keuze te onderbouwen met data. Dat elimineert de cognitieve biases die recreatieve wedders parten spelen: de neiging om te wedden op je favoriete club, de overschatting van recente resultaten, de onderschatting van statistische ruis. Een model heeft geen emoties en geen favoriete club.

Het is belangrijk om realistisch te zijn over wat een basismodel wel en niet kan. Het zal niet elke wedstrijd correct voorspellen. Het zal periodes kennen waarin het structureel naast zit. Maar over een groot aantal weddenschappen geeft het je een systematisch voordeel ten opzichte van wedders die puur op intuïtie opereren.

Welke data je nodig hebt

Een werkend basismodel vereist verrassend weinig data. Je hebt drie kerngegevens nodig per team, berekend over de afgelopen zes tot tien wedstrijden: het gemiddeld aantal gescoorde doelpunten, het gemiddeld aantal geïncasseerde doelpunten en de thuisuitfactor.

De doelpuntengemiddelden vormen de basis van je model. Als Team A thuis gemiddeld 2,1 doelpunten scoort en Team B uit gemiddeld 1,4 doelpunten incasseert, geeft de combinatie van die twee cijfers een indicatie van het verwachte aantal doelpunten dat Team A maakt. Het competitiegemiddelde dient als ijkpunt: als het gemiddeld aantal doelpunten per wedstrijd in de Eredivisie 3,0 is, dan scoort Team A bovengemiddeld en incasseert Team B iets onder het gemiddelde.

De Poisson-verdeling is het wiskundige gereedschap waarmee de meeste basismodellen werken. Deze verdeling berekent de kans op een specifiek aantal doelpunten gegeven een verwacht gemiddelde. Als je verwacht dat Team A gemiddeld 1,8 doelpunten scoort, dan geeft de Poisson-verdeling je de kans op 0 doelpunten, 1 doelpunt, 2 doelpunten, enzovoort. Door dezelfde berekening te maken voor Team B en de resultaten te combineren, krijg je een kansverdeling voor elke mogelijke uitslag.

Openbaar beschikbare databronnen zijn voldoende voor een basismodel. Websites als FBref en Understat bieden uitgebreide statistieken per team en per competitie, inclusief xG-data. Het verzamelen van de basisdata voor de Eredivisie kost een uur per speelronde en levert een dataset op die voldoende is voor een functionerend model.

Het spreadsheet opzetten

De structuur van een basismodel in een spreadsheet is overzichtelijk. Je maakt drie tabbladen: een datatabblad met de ruwe cijfers per team, een berekeningstabblad waar de Poisson-verdeling wordt toegepast en een uitvoertabblad met de berekende kansen per wedstrijd.

Op het datatabblad noteer je per team: het aantal gespeelde wedstrijden, het totaal aantal gescoorde doelpunten thuis en uit, en het totaal aantal geïncasseerde doelpunten thuis en uit. Uit deze cijfers bereken je de aanvalskracht en verdedigingssterkte van elk team, uitgedrukt als ratio ten opzichte van het competitiegemiddelde.

De aanvalskracht van Team A thuis bereken je als het gemiddeld aantal thuisdoelpunten van Team A gedeeld door het competitiegemiddelde voor thuisdoelpunten. Als Team A thuis gemiddeld 2,1 scoort en het competitiegemiddelde 1,5 is, dan is de aanvalskracht 1,40. Een waarde boven 1,00 betekent bovengemiddeld, een waarde eronder benedengemiddeld. Dezelfde berekening maak je voor de verdedigingssterkte, maar dan met de geïncasseerde doelpunten.

Het verwachte aantal doelpunten van Team A in een specifieke wedstrijd bereken je door de aanvalskracht van Team A te vermenigvuldigen met de verdedigingszwakte van Team B en het competitiegemiddelde. Dit getal voer je in de Poisson-formule in, die in Excel of Google Sheets beschikbaar is als de functie POISSON.VERD of POISSON.DIST.

Het model testen

Een model dat je niet toetst aan de werkelijkheid is een hypothese, geen hulpmiddel. Het testen van je model is minstens zo belangrijk als het bouwen ervan, en het vereist een discipline die veel beginners overslaan omdat ze te gretig zijn om te beginnen met wedden.

De eerste stap is backtesting: het toepassen van je model op wedstrijden die al gespeeld zijn. Neem de data van het vorige seizoen, voer ze in je model in en vergelijk de voorspelde kansen met de daadwerkelijke uitslagen. Je model zal niet elke wedstrijd correct voorspellen, dat doet geen enkel model, maar over honderd wedstrijden zou het een patroon moeten tonen dat beter presteert dan willekeurig gokken.

De maatstaf voor je model is niet het percentage correct voorspelde uitslagen maar de kalibratie: als je model een kans van 60 procent toekent aan thuiswinst, dan zou van alle wedstrijden met die inschatting ongeveer 60 procent daadwerkelijk in een thuiswinst moeten eindigen. Als je model systematisch overschat of onderschat, is dat een signaal dat je parameters moeten worden bijgesteld.

Een veelgemaakte fout bij backtesting is het optimaliseren van je model op basis van de historische data totdat het perfect presteert op die specifieke dataset. Dit heet overfitting en het is het gevaarlijkste dat je kunt doen. Een model dat perfect past op het verleden voorspelt de toekomst doorgaans slechter dan een eenvoudiger model, omdat het de ruis in de data heeft geleerd in plaats van de onderliggende patronen.

Resultaten bijhouden

Zodra je model operationeel is en je begint met wedden op basis van de output, is het bijhouden van resultaten essentieel. Noteer per weddenschap: de datum, de wedstrijd, de voorspelde kans door je model, de quotering van de bookmaker, je inzet en de uitkomst.

Over tijd ontstaat een dataset die je in staat stelt om de prestaties van je model te evalueren. De kernvraag is: levert je model een positieve return on investment op? Een ROI van 3 tot 5 procent over een groot aantal weddenschappen is voor een basismodel een uitstekend resultaat. Professionele modellen met geavanceerde data halen doorgaans 2 tot 8 procent, wat illustreert dat zelfs kleine marges op de lange termijn significante winsten opleveren.

Het bijhouden van resultaten onthult ook waar je model sterk en zwak is. Misschien presteert het goed bij thuiswedstrijden maar slecht bij uitwedstrijden. Of het onderschat structureel het aantal gelijkspelen. Of het werkt beter in de ene competitie dan in de andere. Deze inzichten zijn de basis voor gerichte verbeteringen die je model over tijd sterker maken.

Weersta de verleiding om je model na elke slechte week aan te passen. Verliesperiodes horen bij wedden en bij modellen. Een model dat over honderd weddenschappen winstgevend is, zal periodes kennen van tien of twintig verliesgevende weddenschappen op rij. Pas je model pas aan op basis van structurele patronen die zichtbaar worden over minimaal vijftig tot honderd weddenschappen, niet op basis van een slechte week.

De valkuilen van modelbouw

De eerste en meest voorkomende valkuil is het vertrouwen op te weinig data. Een model dat gebaseerd is op de laatste drie wedstrijden is statistisch betekenisloos. Je hebt minimaal zes en bij voorkeur tien wedstrijden per team nodig om betrouwbare gemiddelden te berekenen, en zelfs dan zijn de marges van onzekerheid aanzienlijk.

De tweede valkuil is het negeren van contextfactoren die je model niet vangt. Een puur kwantitatief model houdt geen rekening met trainersontslag, transferperiodes, blessures van sleutelspelers of motivatie. Je model levert een basisinschatting die je handmatig moet bijstellen op basis van kwalitatieve informatie. Die bijstelling vereist ervaring en oordeelsvermogen, en het is precies daar waar de kunst van het wedden begint.

De derde valkuil is de aanname dat een werkend model permanent werkt. Voetbal verandert: teams kopen en verkopen spelers, trainers wijzigen hun systeem, competities evolueren. Een model dat vorig seizoen winstgevend was, kan dit seizoen verliesgevend zijn als de onderliggende parameters zijn verschoven. Regelmatige herijking, minimaal aan het begin van elk seizoen en idealiter na elke transferwindow, is noodzakelijk om je model actueel te houden.

Het model als kompas

Een eigen voetbalwedden-model is geen kristallen bol. Het vertelt je niet wie er wint. Het vertelt je wat de kansen zijn op basis van beschikbare data, en het doet dat zonder emotie, zonder vooringenomenheid en zonder de cognitieve vertekeningen die menselijke analyse onvermijdelijk beïnvloeden. Het is een kompas, geen kaart: het wijst een richting aan maar tekent niet de hele route uit. De wedder die dat onderscheid begrijpt, heeft in zijn spreadsheet niet alleen een rekenhulp maar een denkhulp die elke analyse scherper maakt en elke wedkeuze eerlijker.