Spieken in de simulator: hoe OpenAI robots sneller laat leren van camerabeelden

Deep dive OpenAI publiceerde een trainingsmethode waarbij een onderdeel van het algoritme tijdens het leren de hele simulator-staat mag zien, terwijl de robot zelf puur op camerabeelden werkt. De aanpak laat een Fetch-robotarm in simulatie blokken leren oppakken en transfereert daarna zonder echte oefendata naar de fysieke wereld.

OpenAI heeft een methode gepubliceerd waarmee robots efficiënter leren van camerabeelden.

Hoe de truc werkt

Reinforcement learning, de leertechniek waar dit op gebaseerd is, werkt met vallen en opstaan.

Waarom dat helpt

Een actor die rechtstreeks uit pixels moet leren, vecht op twee fronten tegelijk.

Het experiment

De methode werd getest op een Fetch-robotarm, een industriële opstelling met zeven gewrichten en een tweeving…

De andere helft van het verhaal

Dat een policy uit simulatie zomaar werkt in de echte wereld, is allesbehalve vanzelfsprekend.

Lees het hele verhaal.

māchine Het complete artikel op māchine. Naar het artikel Thom (māchine redactie)