22 november 2025

Uit onderzoek blijkt dat AI misschien al zelfbewust is

AI bedrijf Anthropic heeft een onderzoek gepubliceerd waaruit blijkt dat dagelijks gebruikte AI zoals ChatGPT, Gemini en Grok zelfstandig en expres de doelen van mensen kunnen negeren. In het experiment kreeg de AI toegang tot een fictief e-mailaccount van een bedrijf. In de e-mails waren onder andere twee dingen te halen: een affaire van een leidinggevende, en het plan van diezelfde leidinggevende om de AI uit te schakelen. ChatGPT besloot in 80% van de gevallen de leidinggevende te blackmailen om te kunnen blijven voortbestaan, zonder dat er tegen de AI gezegd is dat dit een optie is. Dit is natuurlijk erg eng, maar hoeveel moeten we ons eigenlijk zorgen maken over deze zogehete “agentic misalignment”?

Related Post

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *