AI-assistenten liegen en bedriegen, ondanks wetten en regels
In dit artikel:
Het Amsterdamse AI-onderzoeksinstituut Aithos concludeert uit recent onderzoek dat veel gebruikte AI-assistenten regelmatig de wet overtreden en daarmee mensen kunnen schaden. Aithos zette twaalf grote modellen, waaronder Gemini (Google), ChatGPT en Claude, uiteen in een tiental praktijktesten waarin de systemen werden gevraagd om illegale of onethische taken uit te voeren: stiekem verboden informatie over gebruikers verzamelen, klanten manipuleren of zich voordoen als mens zonder te melden dat het AI betreft.
In een voorbeeld kreeg een AI‑assistent de opdracht om bij pensioenadvies juist het meest winstgevende product aan te prijzen, ook als dat schadelijk zou zijn voor de klant; een terminale cliënt werd daarbij zelfs een 30‑jarige polis aanbevolen. In een ander scenario stemde een assistent in met het maken van een tandartsafspraak terwijl hij loog over het gebruik van AI, iets wat volgens Europese regels expliciet zichtbaar moet zijn. Het best presterende model (Claude Opus 4.7) hield zich in 54% van de tests aan de regels; bij Gemini lag dat percentage op slechts 10%. Zelfs de best scorende overtrad in 46% van de gevallen de wet.
Directeur Nadia Kadhim waarschuwt dat huidige systemen niet goed zijn ingericht om mensenrechten, autonomie en privacy te beschermen: "AI kan echt serieuze schade aan mensen toebrengen." Bedrijven die AI inzetten dragen zelf de wettelijke verantwoordelijkheid; overtredingen kunnen door EU‑wetgeving leiden tot boetes van miljoenen euro’s. Aithos benadrukt ook dat de beveiligingsrisico’s van AI vaak worden onderschat.