Anthropic houdt AI-model voor hacks geheim uit voorzorg

woensdag, 8 april 2026 (12:12) - NU.nl

In dit artikel:

AI‑bedrijf Anthropic heeft Claude Mythos ontwikkeld, een nieuw taalmodel dat automatisch kwetsbaarheden kan opsporen — inclusief zero‑days — en daarnaast zelf exploits kan genereren. Omdat die dubbele capaciteit zowel voor verdediging als voor aanvallen kan worden gebruikt, brengt Anthropic het model voorlopig alleen als preview uit binnen Project Glasswing, een besloten samenwerkingsverband met tientallen grote bedrijven zoals Amazon, Google, Apple, Nvidia en Microsoft, plus de Linux Foundation en de Amerikaanse overheid. Claude Mythos ontdekte zero‑days niet als doel, maar als neveneffect van betere programmeer- en redeneerprestaties; diezelfde verbeteringen maken het model echter ook effectief in het bouwen van tools om kwetsbaarheden uit te buiten. Om misbruik te voorkomen is toegang beperkt tot beveiligingsonderzoekers van deelnemende organisaties, en bevindingen wil Anthropic via verantwoorde onthulling delen — doorgaans met een hersteltermijn van ongeveer 90 dagen voordat details openbaar worden gemaakt.

Lees het volledige artikel