Waarom AI klokken zelden de juiste tijd tonen, māchine

Een beeldgenerator begint niet met een schets, maar met chaos. Pure ruis, alsof je naar een tv zonder signaal kijkt. Jouw beschrijving “een koekoeksklok op 20 over vier" wordt vertaald naar een wiskundige code. Die code stuurt het proces waarin die ruis stap voor stap wordt weggepoetst en omgevormd. Eerst vaag, dan wat kleur, langzaam vormen, en uiteindelijk een klok die overtuigend oogt. Maar nergens staat in de handleiding: zet de minutenwijzer precies op 120 graden en de uurwijzer op 130. Het model kiest gewoon wat in zijn ogen het meest “klokachtig” lijkt.

En dus gaat het vaak mis. De trainingsdata zit vol scheef gefotografeerde klokken, met halve wijzers of wijzers die niet te lezen zijn. Het model denkt in vage patronen, niet in precieze meetkunde. “20 over vier” klinkt voor ons duidelijk, maar een AI kan het vertalen naar “ongeveer vier uur”. Voeg je ook nog een stijlopdracht toe, dan kiest het model liever voor een mooi schilderijtje dan voor een exacte tijdsaanduiding.

Waarom AI zo vaak 10 over 10 kiest

Als je goed oplet zie je dat AI klokken opvallend vaak eindigen op 10 over 10. Dat is geen toeval. Horlogemerken gebruiken die stand al decennialang in reclames en productfoto’s. De wijzers vormen een symmetrische V die eruitziet als een glimlach, het logo onder de 12 blijft netjes zichtbaar en het oogt simpelweg het mooist. Omdat dit beeld duizenden keren in de trainingsdata voorkomt, heeft de AI geleerd dat dit de “veilige” stand is. Vraag je om een klok zonder strakke instructies, dan kiest het model vaak automatisch voor deze klassieke pose.

Niet elk model werkt zo

Diffusie is de standaard, maar niet de enige manier. Neem GANs: dat staat voor Generative Adversarial Networks, en dat klinkt ingewikkelder dan het is. Zie het als twee AI’s die een spelletje blufpoker spelen. De ene maakt plaatjes, de ander probeert te raden of ze echt zijn. Net zolang tot de eerste zo goed wordt dat de tweede constant gefopt wordt. Jarenlang leverde dat messcherpe beelden op, maar GANs zijn lastig te sturen en lopen vaak vast in herhaling. Daarom zie je ze nu vooral terug in nichetoepassingen zoals deepfakes en medische scans.

Andere technieken pakken het anders aan. Er zijn modellen die een plaatje opbouwen uit kleine visuele blokjes, alsof je met een doos legosteentjes werkt. En er zijn modellen die een beeld opbouwen zoals wij een zin maken: woord voor woord, pixel voor pixel. Die kunnen theoretisch beter met exacte details omgaan, zoals klokwijzers, maar ze zijn traag en leveren vaak minder vloeiende resultaten. Nieuwere hybrides combineren meerdere technieken in de hoop het beste van alle werelden te krijgen, maar ook daar staat de klok nog niet altijd op de juiste tijd.

De wijzers zet je dus nog even zelf

Een AI kan dus een meesterwerk uit chaos trekken, maar als je wilt dat de klok écht op 20 over vier staat, moet je nog steeds zelf de wijzers verzetten. Dat kan door een bestaande klokafbeelding te bewerken, een vectorbestand te gebruiken of extra hulpmiddelen zoals een ouderwets Photoshopje in te zetten.

#mind is blown

Bekijk als Web Story ← Terug naar overzicht