Resultat 1 - 2 av 2
Ny studie avslöjar: AI-agenter klarar inte underhålla projekt över tid
Stort test på 100 verkliga projekt Testet omfattar 100 verkliga kodprojekt från GitHub, där varje projekt i snitt spänner över 233 dagars faktisk utvecklingshistorik och 71 på varandra följande versioner. AI-agenterna fick i uppgift att iterativt driva projektenSammanhang: ...Bild: Montage AI:n introducerade nya buggar i 75 procent av fallen De flesta av de 18 testade modellerna, från leverantörer som OpenAI, Anthropic, Google DeepMind och Alibaba introducerade regressioner i tre av fyra testfall. Bara Anthropics Claude Opus lyckades hålla en stabil nivå, och klarade regression-fritt i drygt hälften av fallen. Det handlar alltså inte om att AI saknar förmåga att skriva kod – det klarar dagens modeller relativt väl. ...
Omnämnda platser: Alibaba Group. Omnämnda personer: Claude Opus.
Mjukvaruaktier faller ner i björnmarknad – på grund av AI-oro
Fortsatt kursras för branschfonder och storbolag Under torsdagen hade fonden iShares Expanded Tech-Software Sector ETF tappat cirka 22 procent från sin senaste topp, vilket enligt CNBC placerar den i björnmarknad. Under torsdagen föll fonden med 5,4 procent,Sammanhang: ...Teknikutvecklingen är snabb; AI-modeller som Claude Opus 4.5 från Anthropic har lanserats tätt och visat förmåga att utföra avancerade arbetsuppgifter, vilket ytterligare ökar trycket på de etablerade leverantörerna....
Omnämnda platser: Sector, Atlassian. Omnämnda personer: Cipher Mining, iShares Expanded, Claude Opus.