māchine

Large Language Model

Ook: LLM, taalmodel, large language models

Definitie

Een AI-model getraind op enorme hoeveelheden tekst om menselijke taal te begrijpen en te genereren. Voorbeelden zijn GPT, Claude en Gemini. Het model voorspelt steeds het volgende stukje tekst (token) op basis van de invoer.

In context

Large language models hebben tussen 2022 en 2026 de manier waarop mensen met computers omgaan ingrijpend veranderd. De technologische doorbraak begon met de transformer-architectuur uit 2017, maar werd pas zichtbaar voor het grote publiek toen ChatGPT in november 2022 werd uitgebracht en in vijf dagen honderd miljoen gebruikers haalde.

Onder de motorkap voorspelt een LLM telkens welk token het meest waarschijnlijk volgt op de tekst die het tot nu toe heeft gezien. Dat klinkt simpel, maar door modellen op honderden miljarden parameters te trainen op tekst van vrijwel het hele open web ontstaat een systeem dat over uiteenlopende onderwerpen kan praten, code kan schrijven, kan vertalen en kan samenvatten zonder dat het ooit expliciet is geprogrammeerd om die taken te doen.

De grote spelers zijn OpenAI (GPT), Anthropic (Claude), Google (Gemini) en Meta (Llama). Daarnaast is er een snelgroeiend ecosysteem van Chinese modellen zoals DeepSeek en Qwen. Het debat in 2026 draait om drie vragen: hoe duur mag training nog worden voor het economisch onhoudbaar wordt, hoe houdbaar is de premisse dat schaal blijft helpen, en wat betekent het auteursrechtelijk dat deze modellen op vrijwel al het beschikbare materiaal zijn getraind zonder expliciete toestemming.

Veelgestelde vragen

In de actualiteit (6)

Andere begrippen