Resultat 1 - 3 av 3
Långa meningar och dålig grammatik räcker för att lura LLM:er
– Sanningen om många av de största språkmodellerna där ute är att den snabba säkerheten är ett dåligt byggt stängsel med så många hål att laga att det är ett oändligt spel med whack-a-mole, säger David Shipley från Beauceron Security. – Den halvfärdigaSammanhang: ...Under anpassningsträningen presenteras modeller med avslagstoken och deras logiter justeras så att de gynnar vägran när de stöter på skadliga förfrågningar. Men det finns ett gap i denna process som forskare vid Palo Alto Networks Unit 42 hänvisar till som ett “avslags-bekräftelselogitgap” I grund och botten eliminerar inte anpassningen faktiskt potentialen för skadliga svar. ...
Omnämnda platser: Metas Llama, Beauceron Security. Omnämnda personer: Palo Alto Networks, David Shipley, Googles Gemma.
Telegrams vd förbjuden att lämna Frankrike
Telegrams vd och grundare Pavel Durov håller formellt på att utredas i Frankrike för misstankar om inblandning i organiserad brottslighet genom meddelandeappen, rapporterar BBC. Utredningen rör bland annat medhjälp till olagliga transaktioner, spridning avSammanhang: ...Utredningen rör bland annat medhjälp till olagliga transaktioner, spridning av barnövergreppsmaterial och vägran att kommunicera med myndigheterna. Pavel Durov är inte frihetsberövad men står under rättslig bevakning och får inte lämna landet. ...
Omnämnda platser: Frankrike, Frankrike Telegrams. Omnämnda personer: Pavel Durov.
Anthropics senaste toppmodell finns nu på Amazon Bedrock
Amazon är också en direkt investerare i Anthropic. Efter att ha meddelat ett tillskott på 2,75 miljarder dollar till företaget i slutet av förra månaden uppgår dess totala investering i Anthropic till 4 miljarder dollar. Claude 3 Opus släpptes i mars, ochSammanhang: ...Den senaste och mest robusta versionen av Claude, Opus, ger färre hallucinationer, bättre visuell bearbetning och färre felaktiga vägran att utföra ofarliga uppgifter, sade Anthropic då. ”Den uppvisar nästan mänskliga nivåer av förståelse och flyt i komplexa uppgifter, vilket leder till gränsen för allmän intelligens”, sa företaget. ...
Omnämnda platser: Anthropic, Bedrock, Google. Omnämnda personer: Andy Jassy.
