Question 1

Wat is een embedding in AI?

Accepted Answer

Een embedding is een numerieke representatie (een vector) van een stuk tekst, beeld of geluid. De vector probeert de betekenis ervan vast te leggen, zodanig dat vergelijkbare inhoud overeenkomstige vectoren krijgt. Embeddings zijn de basis voor semantisch zoeken, RAG en aanbevelingen.

Question 2

Hoe maak je een embedding?

Accepted Answer

Met een embedding-model. Aanbieders als OpenAI, Cohere en Voyage hebben specifieke embedding-modellen via hun API. Voor lokaal gebruik zijn er open varianten als BGE en E5 die je zelf kunt draaien. Je geeft het model je tekst als invoer en krijgt een vector van vaste lengte terug.

Question 3

Wat is een vector database?

Accepted Answer

Een database die gespecialiseerd is in het opslaan en doorzoeken van embeddings. Voor RAG en semantisch zoeken wil je snel de embeddings vinden die het meest lijken op een zoekvraag. Vector databases zoals Pinecone, Weaviate, Qdrant en pgvector (extensie van Postgres) doen dat efficiënt op miljoenen documenten.

Question 4

Hoeveel dimensies heeft een embedding?

Accepted Answer

Dat hangt af van het model. Veel praktische embedding-modellen produceren vectoren van 384, 768, 1024 of 1536 dimensies. Meer dimensies geeft potentieel meer expressiviteit, maar kost ook meer opslag en rekentijd. Voor de meeste toepassingen werkt 768 of 1024 prima.

Embedding

Definitie

In context

Veelgestelde vragen

Wat is een embedding in AI?

Hoe maak je een embedding?

Wat is een vector database?

Hoeveel dimensies heeft een embedding?

Andere begrippen