Definitie
Stelselmatige vertekening in de uitvoer van een AI-model, vaak terug te voeren op de trainingsdata. Speelt onder andere in werving, kredietbeoordeling en gezondheidszorg.
Stelselmatige vertekening in de uitvoer van een AI-model, vaak terug te voeren op de trainingsdata. Speelt onder andere in werving, kredietbeoordeling en gezondheidszorg.
Bias in AI is stelselmatige vertekening in de uitvoer, vaak terug te voeren op vertekeningen in de trainingsdata. Een gezichtsherkenner die slechter presteert op donkere gezichten omdat de trainingsset overwegend wit was, een wervingsalgoritme dat vrouwen lager scoort omdat het is getraind op historische beslissingen waarin minder vrouwen werden aangenomen, een taalmodel dat bij "verpleegkundige" eerder een vrouw veronderstelt en bij "directeur" eerder een man.
Het probleem is structureler dan een technische bug. Trainingsdata weerspiegelen de wereld zoals die was, inclusief de ongelijkheden daarvan. Een model dat patronen leert uit die data, leert ook de ongelijkheden. En omdat het model op grote schaal beslissingen neemt of beïnvloedt, kan het die ongelijkheden versterken en bestendigen.
In 2026 is bias een centraal onderwerp in zowel de academische literatuur als de wetgeving. De AI Act eist datakwaliteit en monitoring op vertekening voor high-risk systemen. Onderzoekers werken aan technieken voor bias-mitigatie tijdens training en evaluatie, maar er is geen wondermiddel. De meest betrouwbare aanpak combineert zorgvuldige data-curatie, expliciete tests op verschillende demografische groepen, en menselijk toezicht op consequentiële beslissingen.
Stelselmatige vertekening in hoe een AI-model presteert of beslist, vaak veroorzaakt door scheve trainingsdata. Het uit zich in lagere accuratesse voor bepaalde groepen, in stereotype associaties of in oneerlijke beslissingen die bepaalde mensen systematisch benadelen. Bias is een technisch én een ethisch probleem.
Vooral via de trainingsdata. Als de data niet representatief zijn voor de werkelijke populatie of als ze historische ongelijkheden bevatten, neemt het model die patronen over. Bias kan ook ontstaan door de keuze van features, door de manier waarop het probleem wordt geformuleerd, en door evaluatie-metrics die bepaalde groepen impliciet minder gewicht geven.
Door de prestaties expliciet op te splitsen naar relevante groepen (geslacht, leeftijd, etniciteit, sociaaleconomische status) en te checken of er significante verschillen zijn. Voor taalmodellen zijn er specifieke benchmarks zoals StereoSet en BBQ. Belangrijk is om naast accuratesse ook te kijken naar valse positieven en negatieven per groep.
Nee. Elke beslissing om groepen wel of niet apart te behandelen is op zichzelf een waardeoordeel. Er bestaan zelfs wiskundige resultaten die aantonen dat sommige eerlijkheidscriteria niet tegelijk waar kunnen zijn. Wat mogelijk is: bias zo veel mogelijk verminderen, transparant zijn over wat is gedaan, en menselijke beoordeling inbouwen voor beslissingen met grote impact.