Meta versterkt de veiligheid van kunstmatige intelligentie (AI): nieuwe tools om gebruikers en ontwikkelaars te beschermen

30 april 2025

Meta heeft een reeks nieuwe beveiligingshulpmiddelen aangekondigd voor zijn modellen van kunstmatige intelligentie, met als doel de ontwikkeling en het gebruik van AI veiliger te maken, zowel voor de makers als voor de verdedigers op het gebied van cybersecurity.

De nieuwigheden betreffen in het bijzonder de familie van modellen Llama, die nu beschikt over bijgewerkte en meer verfijnde middelen om opkomende dreigingen het hoofd te bieden.

Summary

Llama Guard 4: multimodale beveiliging voor tekst en afbeeldingen in het nieuwe AI-programma van Meta

Een van de belangrijkste updates wordt vertegenwoordigd door Llama Guard 4, de evolutie van het aanpasbare beveiligingsfilter van Meta.

De grote innovatie van deze versie is zijn multimodale capaciteit, oftewel de mogelijkheid om veiligheidsregels toe te passen en te analyseren, niet alleen op tekst, maar ook op afbeeldingen. Deze stap is cruciaal, aangezien AI-toepassingen steeds visueler worden.

Llama Guard 4 is al geïntegreerd in de nieuwe API Llama van Meta, momenteel beschikbaar in beperkte preview. Ontwikkelaars kunnen toegang krijgen tot dit hulpmiddel via de officiële pagina van de Llama-beschermingen, of via de platforms Hugging Face en GitHub.

Een andere belangrijke nieuwigheid is LlamaFirewall, een systeem dat is ontworpen om te fungeren als commandocentrum voor de beveiliging in systemen van kunstmatige intelligentie. Dit hulpmiddel maakt het mogelijk om verschillende beschermingsmodellen te coördineren en integreert met de andere beveiligingshulpmiddelen van Meta.

LlamaFirewall is ontworpen om geavanceerde bedreigingen zoals snelle injecties (prompt injection), de generatie van potentieel gevaarlijke code en het risicovolle gedrag van AI-plug-ins tegen te gaan.

In wezen vertegenwoordigt het een bolwerk tegen de meest verraderlijke aanvallen die de integriteit van op kunstmatige intelligentie gebaseerde systemen kunnen compromitteren.

Meta heeft ook zijn systeem voor het detecteren van pogingen tot jailbreak en prompt injection bijgewerkt met de nieuwe Prompt Guard 2 (86M). Dit model is ontworpen om pogingen tot manipulatie van de AI nauwkeuriger te identificeren.

Naast dit is Prompt Guard 2 22M geïntroduceerd, een lichtere en snellere versie. Met een vermindering van de latentie en de berekeningskosten tot 75%, is deze versie ideaal voor degenen die werken met beperkte middelen maar niet willen inleveren op veiligheid.

CyberSec Eval 4: nieuwe benchmarks voor de AI-veiligheid

Meta heeft zich niet beperkt tot het bieden van tools voor ontwikkelaars, maar heeft ook zijn suite van benchmarks CyberSec Eval 4 bijgewerkt, ontworpen om de capaciteiten van AI-systemen op het gebied van cybersecurity te evalueren.

Deze open source suite helpt organisaties de effectiviteit van kunstmatige intelligentie te meten bij het detecteren en reageren op digitale dreigingen.

Due nuovi strumenti arricchiscono questa suite:

– CyberSOC Evaluatie: ontwikkeld in samenwerking met CrowdStrike, dit framework evalueert de prestaties van AI in een reële context van een Security Operation Center (SOC), en biedt een concreet inzicht in de operationele effectiviteit van kunstmatige intelligentie.
– AutoPatchBench: een benchmark die de capaciteit test van AI-modellen, inclusief die van de Llama-familie, om automatisch kwetsbaarheden te identificeren en te corrigeren in de code voordat ze worden uitgebuit door kwaadwillende actoren.

Om de adoptie van deze tools te vergemakkelijken, heeft Meta het programma Llama Defenders gelanceerd, dat bevoorrechte toegang biedt tot een selectie van AI-oplossingen – sommige open source, andere in preview of eigendom – ontworpen om specifieke uitdagingen op het gebied van veiligheid aan te pakken.

Onder de gedeelde hulpmiddelen bevindt zich ook de classificatore automatico di documenti sensibili, intern gebruikt door Meta.

Dit systeem past beveiligingslabels toe op documenten binnen een organisatie, waardoor wordt voorkomen dat vertrouwelijke informatie per ongeluk in AI-systemen wordt ingevoerd waar ze blootgesteld zouden kunnen worden.

Meta heeft ook het groeiende probleem van de door kunstmatige intelligentie gegenereerde valse audio aangepakt, die steeds vaker wordt gebruikt in oplichting en phishingpogingen. Twee nieuwe hulpmiddelen zijn beschikbaar gesteld aan de partners:

– Llama gegenereerde audiodetector
– Llama Audio Watermark Detector

Deze hulpmiddelen helpen bij het identificeren van synthetische stemmen in verdachte oproepen. Bedrijven zoals ZenDesk, Bell Canada en AT&T overwegen al de integratie van deze technologieën in hun beveiligingssystemen.

Privéverwerking: nuttige AI zonder de privacy in gevaar te brengen

Ten slotte heeft Meta een voorproefje gegeven van een technologie in ontwikkeling voor WhatsApp, genaamd elaborazione privata.

Het doel is om kunstmatige intelligentie in staat te stellen nuttige functies te bieden – zoals het samenvatten van ongelezen berichten of het suggereren van antwoorden – zonder dat noch Meta noch WhatsApp toegang hebben tot de inhoud van de berichten.

Deze technologie vertegenwoordigt een belangrijke stap richting een privacy-respecterende AI. Meta neemt een transparante benadering aan door zijn eigen bedreigingsmodel te publiceren en de onderzoeksgemeenschap uit te nodigen om de robuustheid ervan te testen voordat het officieel wordt vrijgegeven.

Met deze reeks aankondigingen toont Meta een concrete inzet om de veiligheid van kunstmatige intelligentie te versterken, zowel vanuit het oogpunt van ontwikkeling als van verdediging.

Het doel is tweeledig. Namelijk om eindgebruikers te beschermen en ontwikkelaars en beveiligingsprofessionals geavanceerde hulpmiddelen te bieden om de voortdurend evoluerende digitale bedreigingen aan te pakken.

In een snel veranderend technologisch landschap, waar AI een steeds centralere rol speelt, zijn initiatieven zoals deze essentieel om een veiliger, transparanter en verantwoordelijker digitale toekomst te waarborgen.

Vorig artikel

Mantra slaat alarm: de ineenstorting van de token OM is een waarschuwingssignaal voor de hele crypto-sector

Volgend artikel

CZ over cryptocurrency en kunstmatige intelligentie (AI) bij Token2049 Dubai

Meta versterkt de veiligheid van kunstmatige intelligentie (AI): nieuwe tools om gebruikers en ontwikkelaars te beschermen

Llama Guard 4: multimodale beveiliging voor tekst en afbeeldingen in het nieuwe AI-programma van Meta

CyberSec Eval 4: nieuwe benchmarks voor de AI-veiligheid

Privéverwerking: nuttige AI zonder de privacy in gevaar te brengen

Shiba Inu vandaag: Dagelijks neutraal, intraday bearish – let op 1U EMA-cluster

Bearish signalen voor Ethereum van TD Sequential: maar is dat genoeg voor een voorspelling?

Daling tokenprijs TRUMP: -5% na de T1-leveringen

Featured video

LATEST

Don't miss out on any updates