Definitie
Een bestaand model verder trainen op een specifieke dataset om het te specialiseren in een domein, stijl of taak. Veel goedkoper dan een model from scratch trainen.
Een bestaand model verder trainen op een specifieke dataset om het te specialiseren in een domein, stijl of taak. Veel goedkoper dan een model from scratch trainen.
Fine-tunen is het verder trainen van een bestaand model op een specifieke dataset, met als doel het te specialiseren in een domein, stijl of taak. Het was tussen 2018 en 2022 de standaardmanier om LLMs aan te passen aan zakelijke behoeften, maar verloor terrein aan RAG en aan beter wordende basismodellen die met prompts al goede resultaten gaven.
Toch is fine-tunen niet weg. Het is nog steeds de beste keuze als je een consistente schrijfstijl wilt forceren, als je een model wilt laten werken in een taal of jargon waarin het zwak is, of als je een open weights model wilt aanpassen voor een specifieke toepassing. Technieken als LoRA (Low-Rank Adaptation) maken het bovendien veel goedkoper dan vroeger door slechts een klein deel van de parameters aan te passen.
In de praktijk worden fine-tuning en RAG steeds vaker gecombineerd. Een model wordt fine-tuned voor stijl en gedrag, RAG wordt gebruikt voor actuele kennis. De keuze voor de ene of de andere techniek is geen geloofsbelijdenis, maar een afweging tussen kosten, snelheid, controle en wat je precies wilt veranderen aan het model.
RAG is beter voor kennis die regelmatig verandert of die je nooit volledig in het model wilt of mag stoppen (klantdata, productinfo). Fine-tunen is beter voor stijl, toon, format-consistentie en voor taken waar het model zich systematisch op een bepaalde manier moet gedragen. Voor veel applicaties is het antwoord: beide combineren.
LoRA staat voor Low-Rank Adaptation. Het is een techniek die slechts een klein aantal extra parameters toevoegt en alleen die traint, in plaats van het hele model bij te werken. Dat maakt fine-tunen veel goedkoper en sneller, vaak haalbaar op consumentenhardware in plaats van een datacenter.
Beperkt. OpenAI, Anthropic en Google bieden fine-tuning aan voor sommige van hun modellen, met restricties op wat je mag aanleren en hoe je het mag gebruiken. Voor volledige controle moet je een open weights model nemen (Llama, Mistral, Qwen) dat je naar believen kunt aanpassen.
Veel minder dan voor training from scratch. Voor stijl-aanpassingen kunnen enkele honderden voorbeelden al verschil maken. Voor diepere gedragsveranderingen werken duizenden tot tienduizenden voorbeelden meestal goed. Kwaliteit is belangrijker dan kwantiteit: tien zorgvuldig gecureerde voorbeelden kunnen meer effect hebben dan duizend slordige.