Question 1

Wanneer kies je fine-tunen en wanneer RAG?

Accepted Answer

RAG is beter voor kennis die regelmatig verandert of die je nooit volledig in het model wilt of mag stoppen (klantdata, productinfo). Fine-tunen is beter voor stijl, toon, format-consistentie en voor taken waar het model zich systematisch op een bepaalde manier moet gedragen. Voor veel applicaties is het antwoord: beide combineren.

Question 2

Wat is LoRA in fine-tuning?

Accepted Answer

LoRA staat voor Low-Rank Adaptation. Het is een techniek die slechts een klein aantal extra parameters toevoegt en alleen die traint, in plaats van het hele model bij te werken. Dat maakt fine-tunen veel goedkoper en sneller, vaak haalbaar op consumentenhardware in plaats van een datacenter.

Question 3

Kun je gesloten modellen fine-tunen?

Accepted Answer

Beperkt. OpenAI, Anthropic en Google bieden fine-tuning aan voor sommige van hun modellen, met restricties op wat je mag aanleren en hoe je het mag gebruiken. Voor volledige controle moet je een open weights model nemen (Llama, Mistral, Qwen) dat je naar believen kunt aanpassen.

Question 4

Hoeveel data heb je nodig om te fine-tunen?

Accepted Answer

Veel minder dan voor training from scratch. Voor stijl-aanpassingen kunnen enkele honderden voorbeelden al verschil maken. Voor diepere gedragsveranderingen werken duizenden tot tienduizenden voorbeelden meestal goed. Kwaliteit is belangrijker dan kwantiteit: tien zorgvuldig gecureerde voorbeelden kunnen meer effect hebben dan duizend slordige.

Fine-tunen

Definitie

In context

Veelgestelde vragen

Wanneer kies je fine-tunen en wanneer RAG?

Wat is LoRA in fine-tuning?

Kun je gesloten modellen fine-tunen?

Hoeveel data heb je nodig om te fine-tunen?

In de actualiteit (1)

OpenAI brengt model distillation naar de API

Andere begrippen