Resultat 1 - 10 av 31
Nu går det att använda AI-modellen Veo 3 via Google Cloud
Googles dotterbolag Deepmind rullade nyligen ut Veo 3, en AI-modell som kan generera realistiska videoklipp med ljud. Senaste nytt är att Veo 3 nu gjorts tillgänglig på Vertex AI, en plattform som körs via Google Cloud. Vill du testa Veo 3 utan kostnadSammanhang: ...Googles dotterbolag Deepmind rullade nyligen ut Veo 3, en AI-modell som kan generera realistiska videoklipp med ljud. Senaste nytt är att Veo 3 nu gjorts tillgänglig på Vertex AI, en plattform som körs via Google Cloud. ...
Omnämnda personer: Google Cloud Googles, Google Cloud.
Elevenlabs släpper mobil AI-röstgenerator
AI-företaget Elevenlabs har släppt en fristående mobilapp till Android och IOS som låter användare generera röstklipp utifrån text. Elevenlabs har tidigare begränsat samma produkt till webben. Ett kostnadsfritt abonnemang låter en användare generera cirkaSammanhang: ...Ett kostnadsfritt abonnemang låter en användare generera cirka 10 minuters ljud. Appen har också tillgång till företagets nya text-tal-modell v3 alpha, som kan justera uttrycket i en röst med hjälp av olika taggar. ...
Nu kan du skapa AI-videor på mobilen med Adobe Firefly
Vill du skapa bilder, ljud och video med hjälp av generativ AI finns nu Adobe Firefly som mobil-app som kan laddas ner från App Store och Google Play. I princip erbjuds samma funktioner som i webbversionen av Firefly, däribland möjligheten att förvandlaSammanhang: ...Vill du skapa bilder, ljud och video med hjälp av generativ AI finns nu Adobe Firefly som mobil-app som kan laddas ner från App Store och Google Play. ...
Omnämnda platser: Runway. Omnämnda personer: Google Play.
Deepfake-attacker är oundvikliga – nu måste företag förbereda sig
– Nästan omedelbart började de lägga märke till vissa konstigheter, säger Kirkwood. Allteftersom intervjun fortskred upptäckte teamet ytterligare saker som väckte oro. – Personen verkade vara alltför stillastående, hon blinkade inte, rörde inte på kroppenSammanhang: ...Utbildningen bör lära medarbetarna att upptäcka varningssignaler som till exempel stelt ljud, läpprörelser som inte stämmer överens och brådskande förfrågningar, säger Mithilesh Ramaswamy, senioringenjör på Microsoft...
Omnämnda personer: James McQuiggan, Reiko Feaver, Mithilesh Ramaswamy.
Sveriges förmåga att möta AI-relaterade hot ligger i botten
Sverige underpresterar när det gäller att möta AI-relaterade hot enligt en ny undersökning från Cisco som bygger på svar från fler än 8 000 näringslivsledare och cybersäkerhetsexperter i 30 länder. 84 procent av de svenska deltagarna uppger där att de drabbatsSammanhang: ...Att tekniken är så lättillgänglig gör det också möjligt att skapa professionellt utformade förfalskningar utan att ha särskilt stor kunskap, där man kan använda sig av text, bild, ljud eller video, säger Henrik Bergqvist, cybersäkerhetsexpert på Cisco Sverige i en kommentar....
Omnämnda platser: Cisco Sverige, Sverige, Sveriges. Omnämnda personer: Henrik Bergqvist.
Nvidias nya AI-modell kan transkribera en timmes tal på en sekund
Nvidia har nu lanserat Parakeet-TDT-0.6B-v2, en öppen källkodsmodell för automatisk taligenkänning (ASR), rapporterar Venture Beat. Modellen är fri att använda kommersiellt under en Creative Commons CC-BY-4.0-licens. Parakeet-TDT-0.6B-v2 är tänkt för utvecklare,Sammanhang: ...Modellen har 600 miljoner parametrar och ska kunna transkribera en timmes ljud på en sekund med hjälp av Nvidia GPU-accelererad hårdvara. Den kan även köras på system med så lite som 2 gigabyte minne....
Google har tagit fram AI-modell för att prata med delfiner
Google har visat upp en ny AI-modell, Dolphin Gemma, som ska försöka avkoda hur delfiner kommunicerar med varandra. Delfiner är bland de mest intelligenta djuren på planeten och kommunicerar delvis genom olika visslingar och läten. Däremot är det fortfarandeSammanhang: ...Modellen har tränats upp på en enorm datasamling med inspelningar av ljud från tygeldefiner från Wild Dolphin Project. Den kommer att börja testas i fält i sommar. Samtidigt kommer Google också att ge öppen tillgång till Dolphin Gemma....
Gemini 2.5 är Googles ”mest intelligenta AI-modell hittills”
Google slår på trumman för Gemini 2.5, en ny AI-modell som sägs erbjuda högre prestanda än liknande resonerande modeller från konkurrenter som Open AI, Anthropic och Deepseek. Google kallar den sin ”mest intelligenta AI-modell hittills”. Enligt ett inläggSammanhang: ...Enligt ett inlägg på bloggen The Keyword kan Gemini 2.5 bland annat analysera information, dra logiska slutsatser, ta hänsyn till kontexten och fatta informerade beslut. Gemini 2.5 klarar av att tolka text, ljud, bilder, video och kod, något som innebär att den till exempel kan användas för att skapa appar och spel. ...
Röstkloningsföretag har för dåliga skydd mot missbruk
En ny studie från Consumer Reports, en amerikansk ideell organisation som granskar produkter för att hjälpa konsumenter, visar att företag som tagit fram generativa AI-verktyg som kan klona röster inte gör tillräckligt för att se till så tekniken inte användsSammanhang: ...Ytterligare två företag, Descript och Resemble AI, ansågs ha bättre skydd eftersom de begränsade uppladdningar av förinspelat ljud. Descript kräver att användaren läser in ett godkännande om att skapa en röstklon, som sedan används för att skapa röstklonen. ...
Omnämnda platser: Speechify. Omnämnda personer: Resemble AI, Consumer Reports.
Farhågan: brusreducering i hörlurar kan orsaka hjärnskador
Nuförtiden är det vanligt med inbyggd brusreducering i dyrare hörlurar, något som stänger ute irriterande ljud och låter oss njuta av musiken i lugn och ro. Nu varnar emellertid brittiska National Health Service (NHS) att flitig användning av brusreduceringSammanhang: ...Nuförtiden är det vanligt med inbyggd brusreducering i dyrare hörlurar, något som stänger ute irriterande ljud och låter oss njuta av musiken i lugn och ro. Nu varnar emellertid brittiska National Health Service (NHS) att flitig användning av brusreducering på sikt kan leda till att våra hjärnor får svårt att förstå ljud och tal, en diagnos som kallas för Audio Processing Disorder (APD). ...