"Ordval"-nyheter Nyhetsfilter

Sortera på relevans Sorterad på datum
Resultat 1 - 1 av 1

Dikter kan lura chattbotar att bryta mot sina säkerhetsregler

En ny studie från universitetet La Sapienza i Rom och tankesmedjan Dex AI visar att AI-chattbotar kan luras att bryta mot sina säkerhetsregler om de får instruktioner i diktform, rapporterar Wired. Metoden kan bland annat användas för att få språkmodeller

Sammanhang: ...Forskarna skriver att det fungerar eftersom dikter använder oväntade ordval, metaforer och ovanlig syntax, vilket förvirrar modellernas semantiska kartor. På så sätt kan de kringgå de områden där säkerhetssystemen normalt skulle utlösas....

Omnämnda platser: Meta, Rom.

idg.se - https://computerswed...egler.html - Datum: 2025-12-01 17:15. - Utan betalvägg »

Källa	Artiklar
« Alla källor
idg.se	1