Wired-journalist Reece Rogers liep een week lang door zijn appartement met een iPhone op zijn voorhoofd. Hij filmde zichzelf terwijl hij salades sneed, drankjes inschonk en zijn schoenen strikte. Niet voor zijn volgers, maar voor een robot die ooit hetzelfde moet kunnen. Een groeiend aantal startups betaalt gewone mensen om hun huishouden vanuit eigen ogen vast te leggen, zodat humanoid robots leren hoe een mens de afwas doet.
Een marktplaats voor je vaat
Het platform dat Rogers gebruikte heet Kled. De startup zit in San Francisco en werd opgericht door de 22-jarige Avi Patel. Het idee is simpel: jij filmt jezelf tijdens dagelijkse handelingen, Kled verkoopt die beelden door aan AI-labs en robotbedrijven, jij krijgt betaald. Topverdieners halen er volgens het bedrijf tot zo'n 7.400 dollar per maand uit. Uitbetaling gebeurt in Solana, een cryptomunt, niet in dollars op je rekening.
Kled haalde tot nu toe negen miljoen dollar op bij investeerders, bij een waardering van honderdvijftig miljoen. Klein bedrag in techland, maar de waardering laat zien hoe veel investeerders verwachten van de markt voor robot-trainingsdata. Patels pitch komt er volgens Wired op neer dat hij iedereen op de planeet de eigen afwas wil laten filmen. Dat is geen marketinggrap. Dat is de businesscase.
De ironie zit ingebakken: mensen worden ingehuurd om aan een machine te laten zien hoe een mens beweegt. De camera kijkt mee vanuit jouw ogen, omdat een robot straks ook door de wereld kijkt vanuit zijn eigen 'kop'. Dat heet egocentric video: beeld vanuit het eerste-persoonsperspectief. Voor een AI-model is dat veel bruikbaarder dan een YouTube-tutorial waarin je vanaf de zijkant naar een kok kijkt.
Waarom robots geen handleiding hebben
Een humanoid robot is in feite een lichaam met motoren, sensoren en een AI-model dat beslist wat er moet bewegen. Dat model leert grotendeels door te kijken, niet door regels te volgen. De vakterm is imitation learning: laat het systeem genoeg voorbeelden zien van een handeling, en het leert die handeling na te doen. Hetzelfde principe waarmee ChatGPT leerde praten door miljarden teksten te lezen.
Het probleem is dat er voor huishoudelijke handelingen vrijwel geen bruikbare data bestond. Het internet staat vol met selfies en kookvideo's, maar bijna niemand filmt zichzelf vanuit het eerste-persoonsperspectief terwijl hij een vaatwasser inruimt of een lamp vervangt. Robotbedrijven zoeken precies dat soort beelden, met handen die het scherm binnenkomen en uitgaan, met de richting waarin een hoofd draait, met de manier waarop een arm uitsteekt naar een pollepel.
De taken die platforms uitschrijven zijn daarom opvallend banaal. Een glas water inschenken zonder te morsen. Een t-shirt opvouwen. Een blikje uit een hoge kast pakken. Een snoer ergens insteken. Het soort handeling waar mensen nauwelijks bij nadenken, en waar een robot juist op vastloopt.
Niet alleen Kled
Kled is de meest zichtbare nieuwkomer, maar het past in een bredere beweging. Figure, een Amerikaanse fabrikant van humanoid robots, draait een datacollectieprogramma onder de naam Project Go-Big, waarin egocentric video een centrale rol speelt. Concurrent 1X Technologies, dat de huishoudrobot Neo aankondigde, traint zijn World Model deels op menselijke beelden. NVIDIA publiceerde recent onderzoek waarin het AI-systeem werd voorgetraind op ruim 20.000 uur egocentric video.
Aan de academische kant levert Meta sinds een paar jaar de Ego4D-dataset: honderden uren first-person video, opgenomen door deelnemers wereldwijd. Die set werd inmiddels uitgebreid met EgoExo4D, waarin dezelfde handeling tegelijk vanuit het eerste-persoonsperspectief en vanaf een externe camera wordt vastgelegd. Wat Kled doet is die academische aanpak commercialiseren en uitbesteden aan gig-werkers, ongeveer zoals Scale AI dat eerder deed met het labelen van tekst en afbeeldingen voor taalmodellen.
De vergelijking met Scale AI is geen toeval. Toen OpenAI en concurrenten hun taalmodellen wilden bijschaven, werd het labelwerk uitbesteed aan duizenden mensen, vaak in Kenia of de Filipijnen, voor een paar dollar per uur. Het zichtbare AI-product draaide op onzichtbare arbeid. Hetzelfde gebeurt nu een verdieping lager, voor de fysieke versie van AI. Het verschil is dat de arbeider deze keer in zijn eigen keuken staat.
Fraude, kwaliteit en de Nigeriaanse stop
Met een marktplaats die in crypto uitbetaalt en geen vaste werknemers heeft, komt fraude vanzelf. Mensen leveren gerecyclede beelden, laten anderen het werk doen, of monteren video's aan elkaar. Kled trok zich volgens berichten eerder dit jaar terug uit Nigeria vanwege wat het bedrijf zelf 'rampant fraud' noemde. Geen unicum: ook Scale AI worstelt al jaren met kwaliteitscontrole op zijn micro-labelaars.
Het kwaliteitsprobleem is niet alleen ethisch. Een robotmodel dat traint op slordige of geforceerde beelden, leert slordige bewegingen. Een humanoid die in een fabriek of huiskamer staat, kan zich geen 'ongeveer goed' veroorloven als hij een glas vasthoudt of langs een kind loopt. Dat is een van de redenen waarom bedrijven als Figure en 1X parallel ook eigen, gecontroleerde datacollectie doen in studio's met sensoren en motion capture-pakken.
Wat dit betekent voor wie er straks mee leeft
De markt voor humanoid robots is nog vroeg. Tesla, Figure, 1X, Apptronik en Agility Robotics laten demo's zien, leveren in bescheiden aantallen aan magazijnen, en mikken op de huiskamer ergens in deze of de volgende jaren. Of dat tijdspad realistisch is, hangt voor een groot deel af van hoe snel deze datapijplijn op gang komt. Een robot die je was kan vouwen, vraagt om duizenden uren beeldmateriaal van mensen die was vouwen. Niet uit Hollywood, maar uit echte slaapkamers.
Voor wie zelf zo'n robot ooit in huis wil halen, betekent dat een ongemakkelijke ruil. De huishoudrobot die jouw afwas overneemt, is in feite getraind door duizenden andere mensen die hun eigen afwas hebben gefilmd, voor enkele euro's of tientjes per opname. En misschien ook door jou, als platforms zoals Kled groeien zoals hun investeerders hopen.
De meest scherpe uitkomst is alvast bekend: zolang de robot zelf nog niet bestaat, is de mens nog steeds zijn eigen schoonmaker. Alleen nu mét camera op het voorhoofd.












