Definitie
Een vector van getallen die de betekenis van een stuk tekst, beeld of geluid representeert. Wordt gebruikt om gelijkenis te berekenen, bijvoorbeeld in zoekmachines en RAG.
Een vector van getallen die de betekenis van een stuk tekst, beeld of geluid representeert. Wordt gebruikt om gelijkenis te berekenen, bijvoorbeeld in zoekmachines en RAG.
Een embedding is een lijst getallen (een vector) die de betekenis van een stuk tekst, beeld of geluid representeert in een hoogdimensionale ruimte. Het idee is dat dingen die in betekenis op elkaar lijken, dichtbij elkaar in die ruimte liggen. "Hond" en "puppy" eindigen dichter bij elkaar dan "hond" en "auto".
Embeddings zijn de stille werkpaarden achter veel moderne AI. Ze maken semantische zoektechnologie mogelijk: in plaats van te zoeken op letterlijke woorden, vergelijk je de embedding van de zoekvraag met die van documenten en vind je teksten die over hetzelfde onderwerp gaan, ongeacht de exacte bewoording. Ze zijn ook de basis voor RAG, voor clustering van klantfeedback, voor aanbevelingsystemen en voor anomalie-detectie.
Het maken van embeddings is een aparte stap: je gebruikt een embedding-model dat tekst (of beeld) als invoer neemt en een vaste vector teruggeeft, meestal van enkele honderden tot duizenden dimensies. Voor zakelijke toepassingen worden die embeddings opgeslagen in een vector database, een gespecialiseerde opslag die snelle gelijkenis-zoekopdrachten ondersteunt.
Een embedding is een numerieke representatie (een vector) van een stuk tekst, beeld of geluid. De vector probeert de betekenis ervan vast te leggen, zodanig dat vergelijkbare inhoud overeenkomstige vectoren krijgt. Embeddings zijn de basis voor semantisch zoeken, RAG en aanbevelingen.
Met een embedding-model. Aanbieders als OpenAI, Cohere en Voyage hebben specifieke embedding-modellen via hun API. Voor lokaal gebruik zijn er open varianten als BGE en E5 die je zelf kunt draaien. Je geeft het model je tekst als invoer en krijgt een vector van vaste lengte terug.
Een database die gespecialiseerd is in het opslaan en doorzoeken van embeddings. Voor RAG en semantisch zoeken wil je snel de embeddings vinden die het meest lijken op een zoekvraag. Vector databases zoals Pinecone, Weaviate, Qdrant en pgvector (extensie van Postgres) doen dat efficiënt op miljoenen documenten.
Dat hangt af van het model. Veel praktische embedding-modellen produceren vectoren van 384, 768, 1024 of 1536 dimensies. Meer dimensies geeft potentieel meer expressiviteit, maar kost ook meer opslag en rekentijd. Voor de meeste toepassingen werkt 768 of 1024 prima.