Sortera på relevans Sorterad på datum
Resultat 1 - 2 av 2

Ny studie avslöjar: AI-agenter klarar inte underhålla projekt över tid

Stort test på 100 verkliga projekt Testet omfattar 100 verkliga kodprojekt från GitHub, där varje projekt i snitt spänner över 233 dagars faktisk utvecklingshistorik och 71 på varandra följande versioner. AI-agenterna fick i uppgift att iterativt driva projekten

Sammanhang: ...Bild: Montage AI:n introducerade nya buggar i 75 procent av fallen De flesta av de 18 testade modellerna, från leverantörer som OpenAI, Anthropic, Google DeepMind och Alibaba introducerade regressioner i tre av fyra testfall. Bara Anthropics Claude Opus lyckades hålla en stabil nivå, och klarade regression-fritt i drygt hälften av fallen. Det handlar alltså inte om att AI saknar förmåga att skriva kod – det klarar dagens modeller relativt väl. ...

Omnämnda platser: Alibaba Group. Omnämnda personer: Claude Opus.

borskollen.se - https://www.borskoll...t-over-tid - Datum: 2026-03-11 20:19. - Utan betalvägg »

Mjukvaruaktier faller ner i björnmarknad – på grund av AI-oro

Fortsatt kursras för branschfonder och storbolag Under torsdagen hade fonden iShares Expanded Tech-Software Sector ETF tappat cirka 22 procent från sin senaste topp, vilket enligt CNBC placerar den i björnmarknad. Under torsdagen föll fonden med 5,4 procent,

Sammanhang: ...Teknikutvecklingen är snabb; AI-modeller som Claude Opus 4.5 från Anthropic har lanserats tätt och visat förmåga att utföra avancerade arbetsuppgifter, vilket ytterligare ökar trycket på de etablerade leverantörerna....

Omnämnda platser: Sector, Atlassian. Omnämnda personer: Cipher Mining, iShares Expanded, Claude Opus.

borskollen.se - https://www.borskoll...-av-ai-oro - Datum: 2026-01-30 14:19. - Utan betalvägg »