māchine

Robotperceptie faalt niet door AI, maar door slecht gekalibreerde sensoren

Sensorfabrikant Orbbec stelt dat robots in de echte wereld niet vastlopen op hun AI-modellen, maar op hun ogen. Zonder degelijke kalibratie en de juiste sensortechniek blijft elke demo een demo.

robot eye calibration sensor

Robots die in een lab perfect blokjes stapelen, lopen in een echt magazijn vast op een glimmende plastic doos. Volgens David Chen, VP Engineering bij sensorbouwer Orbbec, ligt dat niet aan de algoritmen die robots aansturen, maar aan de sensoren die zijn ogen vormen. Hij schrijft dat in een opiniestuk op The Robot Report, waarin hij de robotica-industrie oproept om eerst de fysieke basis op orde te krijgen voordat ze met steeds slimmere AI-modellen aan de haal gaat.

Het verschil tussen demo en magazijn

In een gecontroleerde testopstelling weet een robot precies wat hij ziet. Vaste verlichting, matte oppervlakken, geen mensen die ineens door het beeld lopen. Op een YouTube-filmpje van een Boston Dynamics of een Figure ziet dat er soepel uit.

In een echt distributiecentrum is het anders. Daar is zonlicht dat door een dakraam valt, een vorkheftruck die langsrijdt, een doos met krimpfolie die het licht verkeerd terugkaatst, een fles water die voor de sensor compleet onzichtbaar is. Chen vat het zo samen: machines die het in gecontroleerde omstandigheden prachtig doen, lopen vast op wisselend licht, reflecterende oppervlakken, doorzichtige materialen, bewegende mensen en heftruckverkeer.

Het gevolg: een robot bouwt op basis van die troebele beelden een dieptekaart, en handelt daarnaar. Volgens Chen is het gevaarlijkste scenario niet dat de robot ziet dat hij iets niet weet, maar dat hij overtuigd is van iets dat fout is. Een zelfverzekerde fout bij een arm die naast een mens werkt, kan iemand raken.

Vier manieren waarop een robot probeert te zien

Om te begrijpen waarom kalibratie zo belangrijk is, helpt het te weten welke technieken er bestaan. Robots gebruiken doorgaans een van deze vier, of een combinatie.

Structured light: de sensor projecteert een bekend patroon van infraroodstipjes op het tafereel en meet hoe dat patroon vervormt. Werkt goed binnen, maar valt om bij fel zonlicht of bij meerdere robots die elkaars patronen verstoren.

Stereovisie: twee camera's naast elkaar, net als menselijke ogen. De software berekent diepte uit het verschil tussen beide beelden. Heeft moeite met effen, textuurloze muren en met snel bewegende objecten waar de beelden van uit de pas raken.

Time-of-flight: de sensor schiet een infraroodpulsje af en meet hoe lang het duurt voor het terugkaatst. Snel en compact, maar gevoelig voor reflecties die het signaal meerdere keren laten weerkaatsen voordat het terugkomt.

LiDAR: een ronddraaiende laser die de omgeving aftast. De techniek die ook in Waymo-taxi's en de duurdere Tesla-rivalen zit. Werkt op grote afstand, maar is duur en heeft moeite met regen en mist.

Geen enkele techniek is universeel de beste, schrijft Chen. De juiste keuze hangt af van bereik, licht, materiaal, snelheid, beschikbare rekenkracht en hoe erg een fout mag zijn.

Waarom AI dit niet oplost

De afgelopen jaren is de aandacht in robotica grotendeels naar de softwarekant gegaan. Foundation models voor robotica, zoals die van Google DeepMind en Nvidia, beloven dat een robot via taal en beeld leert wat hij moet doen. Bedrijven als Figure, 1X en Agility Robotics bouwen humanoïde robots die met dezelfde aanpak in fabrieken moeten gaan werken.

Maar al die modellen krijgen hun input van een sensor. Als die input rommel is, helpt geen taalmodel. Chen noemt het eufemistisch: AI kan gaten in een dieptekaart opvullen, maar kan een sensor die structureel verkeerd staat afgesteld niet repareren. Een drift van een paar millimeter in de kalibratie van een stereocamera betekent op tien meter afstand een fout van centimeters. Genoeg om een doos te missen, of een mens te raken.

Kalibratiedrift, het probleem dat niemand op LinkedIn deelt

Kalibratie is het proces waarin een sensor wordt afgeregeld op zijn omgeving: hoe staan de twee camera's precies ten opzichte van elkaar, hoe ver staat de lens van de chip, hoe vertaalt een pixel zich naar een afstand in de echte wereld. In een fabriek wordt dat eenmalig gedaan voordat de robot wordt afgeleverd.

Het probleem: kalibratie loopt weg. Trillingen van een lopende band, temperatuurschommelingen tussen dag en nacht, een lichte tik tegen de behuizing. Alles verschuift de meting. Chen pleit voor sensoren die hun eigen kalibratie tijdens gebruik in de gaten houden, en die piepen als ze afdrijven.

Voor wie een robotstofzuiger of een Tesla met Autopilot heeft, is dit herkenbaar. Een Roomba die ineens tegen de bank botst nadat hij in een doos is gevallen, of een Tesla die een witte vrachtwagen tegen een lichte lucht niet ziet, lopen beide tegen dezelfde categorie fout aan: een sensor die denkt dat hij iets ziet, maar het niet ziet.

Wat een koper zou moeten testen

Orbbec geeft een checklist mee voor bedrijven die robots inkopen. Niet alleen kijken naar de dieptenauwkeurigheid op papier, maar testen onder echte omstandigheden:

  • Hoe presteert de sensor bij glimmende, donkere, doorzichtige en metalen materialen?
  • Wat gebeurt er bij wisselend licht, flikkerende TL-buizen of zonlicht door een raam?
  • Hoeveel rekenkracht kost het, en hoe groot is de vertraging tussen meten en handelen?
  • Hoe gedraagt het systeem zich als meerdere robots tegelijk in dezelfde ruimte werken en hun infraroodpatronen elkaar storen?
  • Hoe lang blijft de kalibratie staan onder stof, trillingen en temperatuurverschillen?

Het zijn vragen die in een productdemo zelden aan bod komen, maar die bepalen of een implementatie na drie maanden nog werkt.

De industrie schaalt nog niet

De achterliggende vraag is waarom robotica zo traag opschaalt terwijl de hype al jaren aanhoudt. Amazon heeft tienduizenden robots in zijn magazijnen rondrijden, maar die volgen vooral vaste paden met streepjescodes op de vloer. De stap naar robots die zelfstandig door een chaotische omgeving navigeren en willekeurige objecten oppakken, blijft moeizaam.

Volgens Chen ligt daar de bottleneck. Niet in de motoren, niet in de algoritmen, maar in de fysieke betrouwbaarheid van wat de robot ziet. Zolang sensoren in productie net iets anders presteren dan in het lab, en zolang die afwijking niet wordt gemeten, blijft elke uitrol een gok.

De oplossing volgens Orbbec ligt in een combinatie: sensor fusion, waarbij verschillende technieken elkaars zwaktes opvangen, plus voortdurende zelfkalibratie en duidelijke onzekerheidsmarges richting het AI-model. Een robot moet niet alleen zien, maar ook weten hoe goed hij ziet.

Belang voor de humanoïden

De boodschap komt op een moment dat tientallen bedrijven humanoïde robots aankondigen die in fabrieken, magazijnen en uiteindelijk huiskamers moeten werken. Tesla's Optimus, Figure 02, Agility Digit, 1X Neo, Unitree G1. Allemaal beloven ze de stap van demo naar werkvloer.

De waarschuwing uit het Orbbec-stuk is dat die stap niet wordt gezet met een groter taalmodel, maar met saaier werk: sensoren die niet drijven, kalibratie die zichzelf onderhoudt, en perceptiesystemen die toegeven wanneer ze het even niet weten.