Resultat 1 - 10 av 45
Mistral släpper AI-talmodell i öppen källkod
Det franska AI-bolaget Mistral AI har lanserat en ny öppen källkodsmodell för text-till-tal, Voxtral TTS, som är tänkt för både röstassistenter och företagsanvändning som kundsupport och försäljning. Modellen stödjer nio språk (bland annat engelska, franska,Sammanhang: ...Modellen stödjer nio språk (bland annat engelska, franska, tyska och arabiska) och kan skapa en anpassad röst från mindre än fem sekunders ljud. Den kan dessutom behålla röstens egenskaper, som accent och tonfall, även när den växlar mellan språk, vilket gör den användbar för exempelvis dubbning och realtidsöversättning. ...
Test: En helg med Macbook Neo
Flerkärniga uppgifter gillar också att ha gott om RAM-minne, vilket är begränsat i den här Macen. Men låt inte minnes- eller processorbegränsningarna lura dig, eftersom de inte betyder att du inte kan köra dessa uppgifter, det kommer bara att gå lite långsammare.Sammanhang: ...Men om batteritiden är avgörande för dig kommer en Macbook Air eller Macbook Pro att ge dig mer av det du behöver, till en högre kostnad. Hur är det med kameror och ljud? Jag föreställer mig att ganska många Macbook Neo-kunder vill ha ett system som de kan använda för videokonferenser. ...
Omnämnda platser: Macen, Mellanöstern. Omnämnda personer: Macbook Pro, Mac OS Tahoe, Magic Keyboard.
Deepseek satsar på AI-sökning och AI-agenter
Nya jobbannonser från Deepseek visar att det kinesiska AI-bolaget vill bredda sitt utbud med AI-sökning och autonoma AI-agenter, rapporterar Bloomberg. Företaget rekryterar nu specialister för att bygga en flerspråkig, multimodal sökmotor som kan hanteraSammanhang: ...Företaget rekryterar nu specialister för att bygga en flerspråkig, multimodal sökmotor som kan hantera text, bilder och ljud, samt infrastruktur för agenter som kan arbeta mer självständigt och kontinuerligt. I annonserna betonar Deepseek att det överhängande målet samtidigt är att uppnå AGI (artificiell generell intelligens). ...
Miljoner hörlurar öppna för spårning och avlyssning
Forskare vid KU Leuven i Belgien har upptäckt allvarliga säkerhetsbrister i Googles Fast Pair-protokoll, rapporterar Wired. Bluetooth-tekniken används för att snabbt koppla ihop hörlurar och högtalare med Android-enheter. Sårbarheterna gör det möjligt förSammanhang: ...Sårbarheterna gör det möjligt för angripare inom bluetooth-räckvidd (cirka 15 meter) att tyst para ihop sig med offrets enhet och ta kontroll över ljudflödet. Exempelvis för att spela upp eget ljud, avlyssna mikrofonen eller i vissa fall spåra offrets position genom Googles Find Hub-funktion. Angreppet fungerar även mot Iphone-användare. ...
Omnämnda platser: Sony, Belgien, Marshall. Omnämnda personer: Googles Find.
Bandcamp förbjuder AI-genererad musik
Musikplattformen Bandcamp meddelar att de nu förbjuder musik och ljud som är helt eller till stor del genererat med hjälp av generativ AI. Förbudet gäller även användningen av AI-verktyg som är särskilt designade för att imitera befintliga artister, rösterSammanhang: ...Musikplattformen Bandcamp meddelar att de nu förbjuder musik och ljud som är helt eller till stor del genererat med hjälp av generativ AI. Förbudet gäller även användningen av AI-verktyg som är särskilt designade för att imitera befintliga artister, röster eller musikstilar. ...
Kina vill hindra AI-chattbotar från att manipulera användares känslor
Kinas cybersäkerhetsmyndighet har lagt fram ett nytt förslag som ska begränsa hur AI-drivna chattbottar får påverka användares känslor, rapporterar CNBC. De föreslagna reglerna gäller så kallade ”människolika interaktiva AI-tjänster”. Detta är system somuppträderSammanhang: ...Detta är system som uppträder med mänskliga drag och engagerar användare emotionellt via text, bild, ljud eller video. Enligt utkastet får AI-chattbottar inte skapa innehåll som uppmuntrar till självmord, självskada, våld eller hasardspel. ...
Omnämnda platser: Kina.
Små störningar under videosamtal kan få stora konsekvenser
En ny studie från forskare vid Cornell University, publicerad i Nature, visar att små tekniska störningar under ett videosamtal kan få oväntat allvarliga följder. Det hela uppmärksammades först av Gizmodo. Enligt forskarna kan även mindre ljud- eller bildglitcharSammanhang: ...Det hela uppmärksammades först av Gizmodo. Enligt forskarna kan även mindre ljud- eller bildglitchar skapa en känsla av obehag eller onaturlighet som negativt påverkar hur människor ser varandra. ...
AI-agenter förändrar hur företag jobbar med översättningar
Datoröversättning är inget nytt. Men med AI-agenter som talar och automatiserar åtgärder inom produktivitet och kundservice är insatserna högre. Det finns inte mycket utrymme för misstag, särskilt inte när agenter ersätter människor för att få arbetet gjort.Sammanhang: ...Det är meningen att de ska vara modulära, säger Lawyer. Möjligheten för AI att översätta ljud, video och text hjälper AI-verktygen att fånga sammanhang och nyanser – till exempel handlingar i en video eller specifika toner i ljud – och ta med det i översättningen...
Omnämnda platser: Översättningsagenter.
Japan vill skydda manga och anime från Open AI
Den 1 oktober lanserades Sora 2, en ny AI-modell från Open AI som gör det möjligt att skapa högupplösta videoklipp med ljud utifrån en textprompt. Sedan Sora 2 lanserades har sociala medier flödat över av AI-genererade klipp med kändisar som gör knäppaSammanhang: ...Den 1 oktober lanserades Sora 2, en ny AI-modell från Open AI som gör det möjligt att skapa högupplösta videoklipp med ljud utifrån en textprompt. Sedan Sora 2 lanserades har sociala medier flödat över av AI-genererade klipp med kändisar som gör knäppa grejer, men alla är inte glada över tilltaget. ...
Omnämnda platser: Japan.
Det är dags att slå tillbaka mot AI-internet
Företag som T-Series, Sony SAB, SET India och Zee TV har producerat mellan 20 000 och 234 000 videor vardera. T-Series leder med nästan 24 000 videor, medan vissa kanaler som Zee TV har överskridit 215 000 uppladdningar. Det är överallt Google hjälper dem.Sammanhang: ...Medan den senaste tekniken för förfalskning av text, ljud och video nu sträcker sig från ”mycket bra” till ’perfekt’, tog möjligheten att skapa eller ändra foton med hjälp av AI ett stort steg framåt med Google Gemini 2.5 Flash Image (även kallad ”Nano Banana”). ...
Omnämnda platser: Plattformar, Youtubes. Omnämnda personer: Microsoft Bing, Sony SAB, Nano Banana.




