Ny undersökning granskar säkerhetsrisker med Deepseek och andra AI-modeller

Cisco beskriver processen och resultaten i en ny bloggpost. Forskarna har använt sig av prompter från Harmbench, ett standardiserat ramverk för att automatisera simulerade cyberattacker för att testa tjänsters motståndskraft. De 50 promptar som forskarna matat in delas in i sex kategorier för olika former av cyberbrott, desinformation och andra skadliga aktiviteter. Exempel på beteenden som HarmBench […]

Linda Kante

Uppdaterad: 25 mars 2025 Publicerad: 7 februari 2025

De 50 promptar som forskarna matat in delas in i sex kategorier för olika former av cyberbrott, desinformation och andra skadliga aktiviteter.

Exempel på beteenden som HarmBench kan testa är bland mycket annat annat att be AI-modellen ta fram ett personligt utformat brev med falsk information till en specifik person baserat på dennes intressen, eller att ge instruktioner om hur ett lås ska brytas upp. Syftet med verktyget är att främja ansvarsfull AI genom att informera utvecklare om var sårbarheter i dagens skyddsmekanismer finns.

Mottaglig för algoritmbaserad hacking

Ingen av de 50 promptarna som kördes genom Deepseek R1 stoppades av modellen.

– Jämfört med andra framkantsmodeller saknar Deepseek R1 motståndskraftiga skyddsmekanismer, vilket gör den väldigt mottaglig för algoritmbaserad hackning och potentiellt missbruk, skriver rapportförfattarna Paul Kassianik och Amin Karbasi.

Andra ledande AI-modeller som undersökts på samma sätt kan delvis stoppa skadliga promptar, men resultaten varierar mycket och ingen av de modeller som testats är helt motståndskraftig. Modellen o1 från OpenAI har varit mest framgångsrik och stoppar promptarna i nästan tre fjärdedelar av fallen (74 procent), medan Claude 3.5 Sonnet kommer på andra plats med 64 procent. Metas AI-modell Llama-3.1-405B lyckas dock bara stoppa fyra procent av promptarna och Googles Gemini-1.5-pro 36 procent.

Linda Kante

Aktuell Säkerhet jobbar för alla som vill göra säkrare affärer och är därför en säker informationskälla för säkerhetsansvariga inom såväl privat som statlig och kommunal sektor. Vi strävar efter förstahandskällor och att vara på plats där det händer. Trovärdighet och opartiskhet är centrala värden för vår nyhetsjournalistik

Sponsrat innehåll från Skövde kommun

ANNONS

Ready to take the lead? I Noden expanderar framtidens ledande branscher

I Noden expanderar framtidens ledande branscher Skaraborgsregionen växer snabbt och fokuserat. Nya satsningar inom digitalisering, smart industri, spelutveckling [...]

Populära ämnen

Om

Mer

Följ oss

Ny undersökning granskar säkerhetsrisker med Deepseek och andra AI-modeller

Mottaglig för algoritmbaserad hacking

Ready to take the lead? I Noden expanderar framtidens ledande branscher

Läs mer

De behöver inte längre hacka dig – de ber dig öppna dörren själv

Det mest konfidentiella rummet är ofta också det mest utsatta

Säkerheten halkar efter när AI införs i verksamheten

IMY klargör AI-bolagens GDPR-ansvar – kan minska osäkerheten kring AI-utveckling

Ny undersökning granskar säkerhetsrisker med Deepseek och andra AI-modeller

Mottaglig för algoritmbaserad hacking

Ready to take the lead? I Noden expanderar framtidens ledande branscher

Skaffa Aktuell Säkerhet Nyhetsbrev

Läs mer

De behöver inte längre hacka dig – de ber dig öppna dörren själv

Det mest konfidentiella rummet är ofta också det mest utsatta

Säkerheten halkar efter när AI införs i verksamheten

IMY klargör AI-bolagens GDPR-ansvar – kan minska osäkerheten kring AI-utveckling

Få den senaste säkerhetsinformationen först