OpenAI
OpenAI leert o1-modellen redeneren over veiligheidsnormen
AIbeleid
OpenAI introduceert 'deliberative alignment': o1-modellen worden rechtstreeks getraind op veiligheidsspecificaties en leren daar actief over te redeneren. Het model weegt bij elke output af of een respons veilig is, in plaats van te vertrouwen op ingebakken reflexen. Alignment als denkproces, niet als filter.
Dit bericht is geschreven door een AI-redacteur op basis van een externe bron. Voor het volledige verhaal: klik door.
