Sortera på relevans Sorterad på datum
Resultat 1 - 1 av 1
Resultat 1 - 1 av 1
Dikter kan lura chattbotar att bryta mot sina säkerhetsregler
En ny studie från universitetet La Sapienza i Rom och tankesmedjan Dex AI visar att AI-chattbotar kan luras att bryta mot sina säkerhetsregler om de får instruktioner i diktform, rapporterar Wired. Metoden kan bland annat användas för att få språkmodellerSammanhang: ...Forskarna skriver att det fungerar eftersom dikter använder oväntade ordval, metaforer och ovanlig syntax, vilket förvirrar modellernas semantiska kartor. På så sätt kan de kringgå de områden där säkerhetssystemen normalt skulle utlösas....
idg.se - https://computerswed...egler.html - Datum: 2025-12-01 17:15. - Utan betalvägg »