Question 1

Wat is het verschil tussen RAG en fine-tuning?

Accepted Answer

RAG voegt kennis toe op het moment van de vraag door documenten op te halen. Fine-tuning past het model zelf aan door het verder te trainen. RAG is sneller, goedkoper en transparanter (je kunt naar de bron verwijzen), fine-tuning is beter als je een specifieke stijl of taal wilt aanleren die niet uit losse documenten te halen is.

Question 2

Vermindert RAG hallucinaties echt?

Accepted Answer

In de praktijk ja, omdat het model zijn antwoord baseert op concrete tekst die je hebt aangeleverd. Volledig weg krijg je hallucinaties niet, want het model kan nog steeds verkeerd interpreteren of buiten de gegeven bronnen treden. Goede RAG-systemen tonen daarom altijd de bron bij het antwoord, zodat de gebruiker kan controleren.

Question 3

Wat heb je nodig om een RAG-systeem te bouwen?

Accepted Answer

Een verzameling documenten, een manier om die om te zetten naar embeddings (vectoren), een vector database om die op te slaan, een retrieval-stap die relevante stukken vindt bij elke vraag, en een LLM dat het antwoord formuleert. Frameworks als LangChain en LlamaIndex bieden deze stappen kant en klaar.

Question 4

Waarom heet het Retrieval-Augmented Generation?

Accepted Answer

Retrieval is het ophalen van relevante documenten, generation is het genereren van het antwoord. Augmented betekent dat het generatieproces wordt verrijkt met de opgehaalde informatie. De term komt uit een paper van Facebook AI Research uit 2020.

RAG

Definitie

In context

Veelgestelde vragen

Wat is het verschil tussen RAG en fine-tuning?

Vermindert RAG hallucinaties echt?

Wat heb je nodig om een RAG-systeem te bouwen?

Waarom heet het Retrieval-Augmented Generation?

Andere begrippen