māchine

RAG

Ook: Retrieval-Augmented Generation, retrieval augmented generation

Definitie

Techniek waarbij een taalmodel eerst relevante documenten ophaalt uit een externe bron en die meeneemt in zijn antwoord. Vermindert hallucinaties en houdt het model actueel zonder hertrainen.

In context

RAG werd populair in 2023 als oplossing voor twee fundamentele problemen van taalmodellen. Een LLM weet alleen wat in zijn trainingsdata stond (vaak een tot twee jaar oud), en het verzint graag dingen als het het antwoord niet zeker weet. RAG pakt beide problemen tegelijk aan.

Het idee is eenvoudig. Voordat het model antwoord geeft, doorzoek je een externe verzameling documenten (bijvoorbeeld de productdocumentatie, een wetboek of de mailbox van een gebruiker) op stukken die relevant lijken. Die stukken plak je in de prompt, samen met de instructie aan het model om antwoord te geven op basis daarvan. Het model heeft daardoor verse, specifieke en verifieerbare context bij elke vraag.

De architectuur is inmiddels de standaard voor zakelijke AI-assistenten. Microsoft Copilot voor SharePoint, Notion AI en vrijwel elke chatbot op een bedrijfswebsite werken zo. De grote uitdagingen zijn de kwaliteit van het zoekproces, het beheer van de bron-collectie (welke documenten worden opgenomen, hoe vaak ververst) en de privacy (welke informatie mag het model wel of niet zien per gebruiker).

Veelgestelde vragen

Andere begrippen