Anthropic heeft een nieuwe AI‑regulering van Anthropic op tafel gelegd die erop gericht is het gebruik van hoog‑risico‑kunstmatige intelligentie te beperken en tegelijkertijd overheden en economie voor te bereiden op de impact van frontier‑modellen. De boodschap is duidelijk: als de capaciteiten van geavanceerde AI zo snel groeien, zijn er reguleringsinstrumenten nodig die gevaarlijke implementaties kunnen blokkeren of ontmoedigen voordat ze ernstige schade veroorzaken.
Summary
De AI‑regulering van Anthropic tussen veiligheid en economische impact
Anthropic heeft twee plannen gepresenteerd die zijn geïntegreerd in het project Policy on the AI Exponential. Het eerste definieert een raamwerk voor geavanceerde AI, het tweede kijkt naar de economische gevolgen voor werknemers en naar de verdeling van de financiële voordelen die door AI worden gegenereerd. Centraal staat een duidelijke eis: overheden de bevoegdheid geven om preventief in te grijpen op modellen die als hoog risico worden beschouwd.
De reikwijdte van het voorstel is duidelijk. De AI‑regulering van Anthropic zou betrekking hebben op systemen die zijn getraind met een rekenvolume van meer dan 10²⁵ floating‑point‑operaties. Ook bedrijven met jaarlijkse AI‑omzetten van meer dan 500 miljoen dollar zouden onder het toepassingsgebied vallen. Anthropic neemt ook ondernemingen op die meer dan 1 miljard dollar per jaar uitgeven aan onderzoek en ontwikkeling op het gebied van AI.
Regels voor AI met hoog risico: transparantie, tests en sancties
Tot de belangrijkste maatregelen behoren onafhankelijke verificaties van de modellen, gedetailleerde documentatie over veiligheid en periodieke risicorapporten door ontwikkelaars. Anthropic wil dat onafhankelijke beoordelaars, met voldoende middelen en toegang tot de modellen, naast de producenten staan om tests en rapporten te controleren. Het doel is de transparantie te versterken zonder alles over te laten aan zelfevaluatie door bedrijven.
Het voorstel voorziet ook in civiele sancties die zijn gekoppeld aan de wereldwijde jaaromzet van bedrijven, met zwaardere boetes bij herhaalde overtredingen. Op deze manier wil Anthropic een economisch afschrikmiddel opbouwen dat in verhouding staat tot de mondiale schaal van de sector. Het bedrijf vraagt bovendien om robuuste, publiek beschreven veiligheidsprogramma’s en meer transparantie richting de bevoegde overheidsinstanties.
Veiligheidsmethoden voor geavanceerde AI‑modellen en toegang voor beoordelaars
Een ander centraal punt van de policy van Anthropic voor AI is de bescherming van de volledige ontwikkelomgeving. Ontwikkelaars zullen hoge standaarden moeten handhaven om zich te verdedigen tegen externe aanvallen en interne dreigingen. Daarnaast vereist het voorstel dat onafhankelijke beoordelaars toegang krijgen tot de modellen om echte, en niet alleen formele, controles uit te voeren.
De vier risico’s die Anthropic aanwijst voor frontier‑AI
Anthropic identificeert vier kritieke risicogebieden: biologisch, cyber, verlies van controle over systemen en geautomatiseerd onderzoek uitgevoerd door kunstmatige intelligentie. De potentiële gevolgen variëren van kwaadwillig gebruik om gevaarlijke virussen te creëren tot kwetsbaarheden voor essentiële diensten zoals ziekenhuizen en energie‑infrastructuren.
Voor het biologische risico dringt het voorstel aan op screeningsinstrumenten voor genetische synthese en biosurveillancesystemen om vroege signalen te detecteren. Aan de cyberkant vraagt het om meer bescherming voor kritieke infrastructuren, de vervanging van kwetsbare legacy‑systemen en overheidsfuncties die specifiek zijn gewijd aan het monitoren van opkomende digitale offensieve capaciteiten.
Anthropic wijst ook op de noodzaak om de controles tegen verlies van controle en tegen geautomatiseerd onderzoek beter te ontwikkelen. In deze gevallen vraagt het bedrijf om regels die in staat zijn gevaarlijke AI‑systemen uit te schakelen of in te perken voordat ze schade veroorzaken.
Publieke veerkracht en overheidscontrole over gevaarlijke AI
Het voorstel beperkt zich niet tot technische veiligheid. Anthropic neemt ook maatregelen op om de veerkracht van de samenleving tegen de impact van geavanceerde AI te versterken, met preventieplannen voor biologische en technologische noodsituaties en met strategieën om kritieke infrastructuren te actualiseren en te beschermen tegen cyberaanvallen.
Het bedrijf roept beleidsmakers op het regelgevend tempo te versnellen, zodat de governance van kunstmatige intelligentie niet achterblijft bij de snelheid waarmee technologische capaciteiten zich ontwikkelen. In de tekst komt een vast uitgangspunt naar voren: veiligheid kan niet alleen afhangen van transparantie en zelfregulering, maar vereist een gezamenlijke inzet van overheden, ontwikkelaars en het maatschappelijk middenveld.
FAQ over de AI‑regulering van Anthropic
Wat activeert de bevoegdheid van overheden om een AI te blokkeren?
Volgens het voorstel zouden overheden de bevoegdheid moeten hebben om preventief in te grijpen op modellen die als hoog risico worden beschouwd. De tekst specificeert echter geen operationele drempels of gedetailleerde procedures om deze bevoegdheid te activeren.
Hoe worden de onafhankelijke beoordelaars gekozen en gefinancierd?
In het artikel staat dat onafhankelijke beoordelaars over voldoende middelen en toegang tot de modellen moeten beschikken, maar het gaat niet in detail in op de selectie, financiering of governance van het controlesysteem.
Wat zijn de belangrijkste geïdentificeerde biologische risico’s?
Anthropic noemt het risico van kwaadwillig gebruik van AI bij het creëren van gevaarlijke virussen. Daarom stelt het screenings voor genetische synthese en biosurveillancesystemen voor.
Hoe pakt het voorstel de cybersecurity‑risico’s aan?
Het voorstel is erop gericht de bescherming van kritieke infrastructuren te versterken, kwetsbare legacy‑systemen te vervangen en overheidsfuncties te creëren die specifiek zijn gewijd aan het monitoren van opkomende digitale offensieve capaciteiten.
Welke sancties zijn voorzien voor herhaalde overtredingen?
Anthropic stelt civiele sancties voor die worden berekend op basis van de wereldwijde jaaromzet, met hogere boetes in het geval van herhaalde inbreuken.

