māchine

Hallucinatie

Ook: hallucineren, hallucinaties, confabulatie

Definitie

Het verschijnsel waarbij een taalmodel feitelijk onjuiste informatie genereert die wel plausibel klinkt. Een bekende zwakte van LLMs, omdat ze waarschijnlijkheid berekenen in plaats van feiten controleren.

In context

Hallucinatie is geen bug die nog gefixt moet worden, het is een direct gevolg van hoe taalmodellen werken. Het model is getraind om waarschijnlijke teksten te produceren, niet om waarheid te toetsen. Zolang een onjuist antwoord statistisch goed past bij wat het model heeft gezien, zal het dat met dezelfde overtuiging geven als een correct antwoord.

In de praktijk levert dit problemen op in elk domein waar feitelijke juistheid telt. Advocaten hebben rechtbankzaken verloren door verwijzingen naar verzonnen jurisprudentie. Journalisten zijn op de vingers getikt voor citaten die nooit zijn uitgesproken. Artsen waarschuwen voor klinische beslissingen op basis van valse referenties. Het probleem wordt verergerd door de overtuigingskracht van het taalgebruik: een vloeiend en stellig geschreven onwaarheid is moeilijker te herkennen dan een schoolse fout.

Onderzoekers werken aan oplossingen. RAG koppelt antwoorden aan opgehaalde bronnen, reasoning models denken langer na voor ze antwoorden, en training met menselijke feedback leert modellen wanneer ze beter kunnen zeggen "dat weet ik niet". Geen van deze technieken elimineert hallucinaties volledig. De meest betrouwbare verdediging blijft een mens die het antwoord controleert tegen de werkelijkheid, vooral bij beslissingen met hoge impact.

Veelgestelde vragen

Andere begrippen