Resultat 1 - 10 av 33
Förarlösa bilar börjar bete sig som idioter – och det gör dem säkrare
– Intressant nog ses självförtroende och säkerhet ofta som motsatta saker som måste balanseras, säger Margines. – Men det vi ser är raka motsatsen: självsäkerhet och säkerhet går faktiskt hand i hand – och det säkraste beteendet är ofta självsäkert. TillSammanhang: ...Istället använder de en 30-kanals riktad högtalaruppsättning för att rikta riktat ljud mot fotgängare eller andra, vilket erbjuder vad Zoox anser vara en mindre störande form av kommunikation. ...
Omnämnda platser: Austin, Foster City. Omnämnda personer: Kara Kockelman.
xAI släpper bild- och videogenerator som tillåter sexuellt innehåll
Elon Musks AI-bolag xAI har lanserat bild- och videogeneratorn Grok Imagine, som kan omvandla text- eller bilddata till 15-sekunder långa videor med ljud. Verktyget innehåller även ett så kallat ”spicy mode”, som möjliggör generering av sexuellt explicitSammanhang: ...Elon Musks AI-bolag xAI har lanserat bild- och videogeneratorn Grok Imagine, som kan omvandla text- eller bilddata till 15-sekunder långa videor med ljud. Verktyget innehåller även ett så kallat ”spicy mode”, som möjliggör generering av sexuellt explicit innehåll, inklusive delvis nakenhet, rapporterar Techcrunch. ...
Omnämnda personer: Grok AI:s, Grok Imagine, Elon Musks.
Nu går det att använda AI-modellen Veo 3 via Google Cloud
Googles dotterbolag Deepmind rullade nyligen ut Veo 3, en AI-modell som kan generera realistiska videoklipp med ljud. Senaste nytt är att Veo 3 nu gjorts tillgänglig på Vertex AI, en plattform som körs via Google Cloud. Vill du testa Veo 3 utan kostnadSammanhang: ...Googles dotterbolag Deepmind rullade nyligen ut Veo 3, en AI-modell som kan generera realistiska videoklipp med ljud. Senaste nytt är att Veo 3 nu gjorts tillgänglig på Vertex AI, en plattform som körs via Google Cloud. ...
Omnämnda personer: Google Cloud Googles, Google Cloud.
Elevenlabs släpper mobil AI-röstgenerator
AI-företaget Elevenlabs har släppt en fristående mobilapp till Android och IOS som låter användare generera röstklipp utifrån text. Elevenlabs har tidigare begränsat samma produkt till webben. Ett kostnadsfritt abonnemang låter en användare generera cirkaSammanhang: ...Ett kostnadsfritt abonnemang låter en användare generera cirka 10 minuters ljud. Appen har också tillgång till företagets nya text-tal-modell v3 alpha, som kan justera uttrycket i en röst med hjälp av olika taggar. ...
Nu kan du skapa AI-videor på mobilen med Adobe Firefly
Vill du skapa bilder, ljud och video med hjälp av generativ AI finns nu Adobe Firefly som mobil-app som kan laddas ner från App Store och Google Play. I princip erbjuds samma funktioner som i webbversionen av Firefly, däribland möjligheten att förvandlaSammanhang: ...Vill du skapa bilder, ljud och video med hjälp av generativ AI finns nu Adobe Firefly som mobil-app som kan laddas ner från App Store och Google Play. ...
Omnämnda platser: Runway. Omnämnda personer: Google Play.
Deepfake-attacker är oundvikliga – nu måste företag förbereda sig
– Nästan omedelbart började de lägga märke till vissa konstigheter, säger Kirkwood. Allteftersom intervjun fortskred upptäckte teamet ytterligare saker som väckte oro. – Personen verkade vara alltför stillastående, hon blinkade inte, rörde inte på kroppenSammanhang: ...Utbildningen bör lära medarbetarna att upptäcka varningssignaler som till exempel stelt ljud, läpprörelser som inte stämmer överens och brådskande förfrågningar, säger Mithilesh Ramaswamy, senioringenjör på Microsoft...
Omnämnda personer: James McQuiggan, Reiko Feaver, Mithilesh Ramaswamy.
Sveriges förmåga att möta AI-relaterade hot ligger i botten
Sverige underpresterar när det gäller att möta AI-relaterade hot enligt en ny undersökning från Cisco som bygger på svar från fler än 8 000 näringslivsledare och cybersäkerhetsexperter i 30 länder. 84 procent av de svenska deltagarna uppger där att de drabbatsSammanhang: ...Att tekniken är så lättillgänglig gör det också möjligt att skapa professionellt utformade förfalskningar utan att ha särskilt stor kunskap, där man kan använda sig av text, bild, ljud eller video, säger Henrik Bergqvist, cybersäkerhetsexpert på Cisco Sverige i en kommentar....
Omnämnda platser: Cisco Sverige, Sverige, Sveriges. Omnämnda personer: Henrik Bergqvist.
Nvidias nya AI-modell kan transkribera en timmes tal på en sekund
Nvidia har nu lanserat Parakeet-TDT-0.6B-v2, en öppen källkodsmodell för automatisk taligenkänning (ASR), rapporterar Venture Beat. Modellen är fri att använda kommersiellt under en Creative Commons CC-BY-4.0-licens. Parakeet-TDT-0.6B-v2 är tänkt för utvecklare,Sammanhang: ...Modellen har 600 miljoner parametrar och ska kunna transkribera en timmes ljud på en sekund med hjälp av Nvidia GPU-accelererad hårdvara. Den kan även köras på system med så lite som 2 gigabyte minne....
Google har tagit fram AI-modell för att prata med delfiner
Google har visat upp en ny AI-modell, Dolphin Gemma, som ska försöka avkoda hur delfiner kommunicerar med varandra. Delfiner är bland de mest intelligenta djuren på planeten och kommunicerar delvis genom olika visslingar och läten. Däremot är det fortfarandeSammanhang: ...Modellen har tränats upp på en enorm datasamling med inspelningar av ljud från tygeldefiner från Wild Dolphin Project. Den kommer att börja testas i fält i sommar. Samtidigt kommer Google också att ge öppen tillgång till Dolphin Gemma....
Gemini 2.5 är Googles ”mest intelligenta AI-modell hittills”
Google slår på trumman för Gemini 2.5, en ny AI-modell som sägs erbjuda högre prestanda än liknande resonerande modeller från konkurrenter som Open AI, Anthropic och Deepseek. Google kallar den sin ”mest intelligenta AI-modell hittills”. Enligt ett inläggSammanhang: ...Enligt ett inlägg på bloggen The Keyword kan Gemini 2.5 bland annat analysera information, dra logiska slutsatser, ta hänsyn till kontexten och fatta informerade beslut. Gemini 2.5 klarar av att tolka text, ljud, bilder, video och kod, något som innebär att den till exempel kan användas för att skapa appar och spel. ...