māchine

Embedding

Ook: embeddings, vector-embedding, vector embedding

Definitie

Een vector van getallen die de betekenis van een stuk tekst, beeld of geluid representeert. Wordt gebruikt om gelijkenis te berekenen, bijvoorbeeld in zoekmachines en RAG.

In context

Een embedding is een lijst getallen (een vector) die de betekenis van een stuk tekst, beeld of geluid representeert in een hoogdimensionale ruimte. Het idee is dat dingen die in betekenis op elkaar lijken, dichtbij elkaar in die ruimte liggen. "Hond" en "puppy" eindigen dichter bij elkaar dan "hond" en "auto".

Embeddings zijn de stille werkpaarden achter veel moderne AI. Ze maken semantische zoektechnologie mogelijk: in plaats van te zoeken op letterlijke woorden, vergelijk je de embedding van de zoekvraag met die van documenten en vind je teksten die over hetzelfde onderwerp gaan, ongeacht de exacte bewoording. Ze zijn ook de basis voor RAG, voor clustering van klantfeedback, voor aanbevelingsystemen en voor anomalie-detectie.

Het maken van embeddings is een aparte stap: je gebruikt een embedding-model dat tekst (of beeld) als invoer neemt en een vaste vector teruggeeft, meestal van enkele honderden tot duizenden dimensies. Voor zakelijke toepassingen worden die embeddings opgeslagen in een vector database, een gespecialiseerde opslag die snelle gelijkenis-zoekopdrachten ondersteunt.

Veelgestelde vragen

Andere begrippen