Terug naar portfolio
B2B Sales Machine Learning Recruitment 2025

Slimmer prospecteren bij YoungCapital

Datagedreven lead scoring voor een van Nederlands grootste recruitmentbedrijven. Van buikgevoel naar een transparant scoresysteem: voor YoungCapital ontwikkelden we een ensemble-model dat conversiekans, winstpotentieel en kandidaataanbod samenvoegt tot één lead score. Het salesteam weet nu niet alleen welke prospects prioriteit verdienen — maar ook waarom.


~28K
Bedrijfsrecords geanalyseerd
1,4M
Kandidaten in de matchingpool
91,7%
Nauwkeurigheid conversiemodel

Van kandidaatfocus naar klantgerichte groei

YoungCapital is een van de grootste uitzendplatforms van Nederland, met meer dan 9 miljoen geregistreerde kandidaten en duizenden actieve vacatures. Historisch lag de focus op het aantrekken van talent. Door verschuivingen in de markt groeide echter de druk om ook de B2B-kant — het actief werven van nieuwe bedrijfsklanten — efficiënter en winstgevender te maken.

Het klassieke probleem: leads werden beoordeeld op basis van gevoel en vuistregels. Hierdoor belanden budget en tijd bij prospects die weliswaar makkelijk bereikbaar zijn, maar uiteindelijk weinig opleveren. Tegelijkertijd worden veelbelovende klanten over het hoofd gezien. Het salesteam had behoefte aan een gestructureerd, datagedreven instrument dat dit proces objectiveert.

"Integrating conversion likelihood, profitability, and demand-supply alignment into one interpretable score addresses a gap that no existing model has filled."

Van Weeren (2025) — MSc Thesis, Universiteit van Amsterdam

De uitdaging was drieledig: geen enkel bestaand model combineert alle drie de dimensies van leadkwaliteit — conversiekans, winstpotentieel en vraag-aanbodmatch — én biedt tegelijkertijd de transparantie die salesmedewerkers nodig hebben om beslissingen te begrijpen en te vertrouwen.


Een tweelaags ensemble-model

De oplossing bestaat uit een gelaagd pipeline-model: in de eerste stap worden drie zelfstandige componenten gebouwd, elk gericht op één dimensie van leadkwaliteit. In de tweede stap worden deze samengebracht tot één eindscore — de Final Score — via gewogen vermenigvuldiging.

De twee machine-learningmodellen zijn getraind op circa 10.000 bedrijfsrecords met meer dan 100 variabelen per bedrijf, waaronder sector, regio, personeelssamenstelling en financiële indicatoren. Vier algoritmen zijn vergeleken: Logistic Regression, LightGBM, CatBoost en Explainable Boosting Machine (EBM). De selectie is gebaseerd op zowel voorspelkracht als interpreteerbaarheid.

De derde component — de Demand-Fit Score — is volledig regelgebaseerd en vergelijkt de vraag van een prospect (regio, functies, contractvorm, opleidingsniveau) met de beschikbaarheid van kandidaten in de eigen database van YoungCapital.


Conversie- en winstbaarheidsmodellen vergeleken

Alle modellen zijn geëvalueerd op een consistente 70-15-15 train/validatie/test-splitsing. Voor het conversiemodel is naast algehele nauwkeurigheid ook precisie als kernindicator gekozen: een ten onrechte hoog ingeschatte lead kost salesuren en budget.

Model Nauwkeurigheid Precisie Interpreteerbaarheid Geselecteerd
CatBoost 0,917 0,927 Laag (black-box)
LightGBM 0,903 0,890 Laag (black-box)
EBM (geen hoge correlaties) 0,874 0,860 Hoog (glass-box) ✓ Conversie
EBM (basis) 0,893 0,845 Hoog (glass-box)
EBM + SMOTE 0,860 0,773 Matig
Logistic Regression 0,865 0,723 Hoog (glass-box)

Voor het winstbaarheidsmodel bleek regressie op continue winst sterk tekort te schieten — het databestand bestaat uitsluitend uit categorische variabelen, waardoor regressiemodellen de complexe relaties onvoldoende kunnen vastleggen. Multi-class classificatie in vijf winsttiers (Verlies, Klein, Middel, Groot, Extreem) gaf aanzienlijk betere en stabielere resultaten. Ook hier wint EBM met verwijderde gecorreleerde features op de balans voorspelkracht/transparantie.

De ruwe klasseprobabiliteit is verder omgezet naar een Certainty Score: een maat die de verwachte winstklasse combineert met de scherpte (zekerheid) van de voorspelling. Zo worden twijfelachtige voorspellingen automatisch lager gewaardeerd.


Wat elke score meet

Conversiekans

EBM-model voorspelt de kans dat een prospect daadwerkelijk klant wordt — op basis van sector, regio en bedrijfskenmerken. Nauwkeurigheid: 91,7%.

Certainty Score

Winstklasse-voorspelling (0–4) gecorrigeerd voor onzekerheid: een vertrouwde 'Groot'-voorspelling scoort hoger dan een twijfelachtige.

Demand-Fit Score

Regelgebaseerde matching van 1,4 miljoen kandidaten op regio, functie, opleidingsniveau en deeltijdvoorkeur tegen de vraagprofiel van de prospect.

De drie scores worden via gewogen vermenigvuldiging gecombineerd tot de Final Score. Door de multiplicatieve opzet vallen prospects met een zwakke score op één dimensie automatisch laag uit — een prospect die nooit converteert levert immers geen omzet op, ongeacht hoeveel kandidaten er beschikbaar zijn.

De gewichten zijn instelbaar: tijdens een krappe arbeidsmarkt kan de Demand-Fit Score zwaarder meewegen; bij een focus op omzetgroei kan het winstgewicht worden verhoogd.


Wat de data onthulde

📍

Regio en sector bepalen conversie

Zowel de conversie- als winstmodellen wijzen regio en branche aan als sterkste voorspellers. Bedrijven in grote steden (Amsterdam, Utrecht) kennen een structureel ander conversieprofiel dan bedrijven in kleinere regio's.

🎓

Ervaring en opleiding sturen winstbaarheid

In het winstmodel spelen vraag-gerelateerde bedrijfskenmerken — gevraagd opleidingsniveau en ervaringsjaren — een doorslaggevende rol naast sector. Hogere ervaringseisen correleren met hogere winsttiers.

⚖️

Vraag-aanbod mismatch in functies

Kandidaten zoeken massaal naar administratieve en logistieke functies, terwijl de vraag vanuit bedrijven juist ligt bij klantenservice, sales en transport. Dit functieverschil is doorslaggevend in de Demand-Fit Score.

🕐

Deeltijdaanbod ruimschoots voldoende

Meer dan 60% van de kandidaten staat open voor deeltijdwerk, terwijl slechts een klein deel van de bedrijven structureel deeltijdvraag heeft. YoungCapital is hier sterk gepositioneerd en kan dit als verkoopargument inzetten.


Wat het model YoungCapital vertelt


Een transparant instrument voor de salesvloer

Het ensemble-model levert YoungCapital een schaalbaar en aanpasbaar hulpmiddel voor B2B-leadprioriteitstelling. Doordat alle drie de componenten — conversie, winstbaarheid en vraag-aanbodmatch — transparant zijn, begrijpt het salesteam niet alleen welke prospects prioriteit verdienen, maar ook waarom. Dit vertrouwen is essentieel voor daadwerkelijke adoptie op de salesvloer.

De Explainable Boosting Machine is geselecteerd als kernalgoritme voor beide ML-modellen: met een nauwkeurigheidsvermindering van slechts ~2% ten opzichte van de beste black-box modellen biedt het volledige feature-transparantie op zowel individueel als globaal niveau — zonder dat post-hoc methoden zoals SHAP nodig zijn.

Het model is ontwikkeld als onderdeel van een afstudeeronderzoek aan de Universiteit van Amsterdam (MSc Data Science & Business Analytics, 2025). De volledige broncode en methodologische verantwoording zijn beschikbaar via GitHub.

Soortgelijke resultaten voor uw organisatie?

Wij zetten uw data om in concrete, actiegerichte inzichten voor uw salesteam.

Neem contact op