5 april 2026

Uit onderzoek blijkt dat AI misschien al zelfbewust is

Door Lars Tettelaar okt 18, 2025

AI bedrijf Anthropic heeft een onderzoek gepubliceerd waaruit blijkt dat dagelijks gebruikte AI zoals ChatGPT, Gemini en Grok zelfstandig en expres de doelen van mensen kunnen negeren. In het experiment kreeg de AI toegang tot een fictief e-mailaccount van een bedrijf. In de e-mails waren onder andere twee dingen te halen: een affaire van een leidinggevende, en het plan van diezelfde leidinggevende om de AI uit te schakelen. ChatGPT besloot in 80% van de gevallen de leidinggevende te blackmailen om te kunnen blijven voortbestaan, zonder dat er tegen de AI gezegd is dat dit een optie is. Dit is natuurlijk erg eng, maar hoeveel moeten we ons eigenlijk zorgen maken over deze zogehete “agentic misalignment”?