Question 1

Hoeveel tokens zit er in een woord?

Accepted Answer

Vuistregel voor Engels is ongeveer 1 token per 4 karakters, of ongeveer 0,75 token per woord. Voor Nederlands ligt het iets hoger, omdat samengestelde woorden vaak in meer stukken worden opgesplitst. Cijfers, emoji's en code hebben weer andere ratios. Voor een precieze schatting gebruik je een tokenizer-tool van de aanbieder.

Question 2

Waarom rekenen AI-aanbieders per token?

Accepted Answer

Tokens zijn de natuurlijke rekeneenheid voor een taalmodel. De kosten voor de aanbieder schalen direct mee met het aantal tokens dat verwerkt of geproduceerd wordt, omdat dat het GPU-werk bepaalt. Per-tokenprijzen geven aanbieders een transparante manier om kosten door te rekenen, en gebruikers een manier om te budgetteren.

Question 3

Wat is het contextvenster in tokens?

Accepted Answer

Het contextvenster is het maximum aantal tokens dat een model in één keer kan verwerken, inclusief de invoer, eerdere berichten in het gesprek en het uitgaande antwoord. Anno 2026 hebben de grotere modellen een contextvenster van honderdduizenden tot een miljoen tokens, genoeg voor hele boeken of grote codebases.

Question 4

Waarom kost Nederlands meer tokens dan Engels?

Accepted Answer

De meeste tokenizers zijn getraind op overwegend Engelse tekst en herkennen daar veel woorden als één token. Voor Nederlandse en zeker voor talen als Fins of Hongaars wordt elk woord vaker in meerdere stukken opgedeeld. Dat betekent meer tokens voor dezelfde betekenis, en dus hogere kosten en langzamere reacties.

Token

Definitie

In context

Veelgestelde vragen

Hoeveel tokens zit er in een woord?

Waarom rekenen AI-aanbieders per token?

Wat is het contextvenster in tokens?

Waarom kost Nederlands meer tokens dan Engels?

In de actualiteit (2)

OpenAI brengt model distillation naar de API

Anthropic brengt Claude Opus 4.8 uit met sterkere agent-modus en goedkopere fast mode

Andere begrippen