māchine

Quantization

Ook: kwantisatie, quantisatie

Definitie

Het comprimeren van een model door gewichten op te slaan met minder bits (bijvoorbeeld 4 in plaats van 16). Maakt het mogelijk om grote modellen lokaal te draaien.

Andere begrippen