Resultat 1 - 10 av 37
Röstsamtalen med Gemini blir mer ”dynamiska och engagerande”
Enligt ett mejl som skickats ut kommer röstsamtalen med Gemini bli ännu mer ”dynamiska och engagerande”. Google har puffat hårt för Gemini Live senaste halvåret och flera av reklamfilmerna har fått miljontals visningar på Youtube. Att ha röstsamtal med enSammanhang: ...Google skriver att senaste modellen gjort att Live bättre förstår flera olika språk, dialekter och brytningar i en och samma konversation. Det går att be Gemini Live att prata svenska men användarupplevelsen blir då mer komisk än något annat, då svenska rösten ligger väldigt långt bort från den engelska i kvalitet. ...
Omnämnda platser: Youtube, →. Omnämnda personer: GEMINI LIVE, Gemini Live.
Whatsapp kommer få inbyggd översättning
Pixel-telefoner har en funktion kallad Liveöversättning som kan översätta text inuti appar, inklusive meddelandetjänster. Whatsapp arbetar på en liknande inbyggd funktion. Skärmbilder från Wabetainfo visar hur appen kan översätta mellan olika språk, samtattSammanhang: ...Skärmbilder från Wabetainfo visar hur appen kan översätta mellan olika språk, samt att språket kan kännas igen automatiskt. En nedladdning på 24 MB behövs för att Whatsapp ska kunna identifiera språken. ...
Omnämnda platser: Liveöversättning.
Wikitok visar Wikipedia-artiklar i Tiktok-liknande flöde
New York-baserade utvecklaren Isaac Gemal har skapat en webbapp kallad Wikitok som visar slumpmässiga Wikipedia-artiklar i ett horisontellt flöde som påminner om Tiktok. Appen har ingen algoritm: den visar en slumpartad artikel vid varje svep, genom WikipediasSammanhang: ...Som standard visas engelska artiklar, men det går även att växla till artiklar på andra språk. Utvecklaren har publicerat källkoden på Github så alla har möjlighet att bidra till projektet....
Omnämnda platser: Github, Tiktok.
Open AI-modell förbryllar genom att ”tänka” på kinesiska
En fascinerade aspekt av dagens stora språkmodeller är att inte ens experter och utvecklare förstår exakt hur de fungerar. Ett exempel är att Open AI:s modell O1 ibland börjar ”tänka” på kinesiska, persiska eller något annat språk som frågan inte ställdesSammanhang: ...Modellen ger svaren på rätt språk men stegen – ”tänkandet” – som leder fram till svaret kan utföras på kinesiska eller andra språk. ...
VLC har visat upp undertexter som genereras i realtid
VLC är en fransk videospelare med öppen källkod som snart funnits i 24 år. Programmet är populärt och har laddats hem över sex miljarder gånger från videolan.org. Utvecklaren visade nyligen upp en inbyggd funktion som automatiskt skapar undertexter för filmerSammanhang: ...Video LAN skriver att översättningarna baseras på lokala AI-modeller med öppen källkod, med stöd för över 100 språk. Företaget har inte berättat när funktionen kommer släppas....
Omnämnda platser: videolan.org.
God jul önskar Swedroid
I dag är det julafton, och med detta vill redaktionen ta tillfället i akt att önska samtliga läsare såväl som medlemmar i Swedroids community en riktigt god och fröjdefull jul. För den som är intresserad av att följa tomtens framfart tipsar vi i traditionsenligSammanhang: ...Tomten talar som standard engelska, men kan tala svenska och en mängd andra språk om man ber snällt. Under den åtföljande juldagen startar förstås den årliga mellandagsrean. För den som önskar ta emot eller lämna tips på teknikfynd finns en fyndtipstråd i forumet att tillgå. ...
Omnämnda platser: Santa Tracker, Nordpolen. Omnämnda personer: Googles Santa Tracker.
Googles nya videoskapare Veo 2 erbjuder trovärdigare fysik
Strax efter att Google släppte videomodellen Veo tidigare i december har uppföljaren Veo 2 nu introducerats. Veo 2 är bättre på att imitera verklighetens fysik så objekt och människor rör sig mer övertygande, vilket Sora från Open AI har stora problem med.Sammanhang: ...En annan förbättring är att modellen kan härma filmvärldens och filmfotografiets språk. Användare kan ange genre, objektiv och filmiska effekter när de skriver beskrivningarna som skapar videosnutten. ...
Omnämnda platser: Europa.
Manusförfattare är förbannade på AI-företagen på grund av stulna undertexter
Företag suger upp internet som en dammsugare för att träna olika typer av AI-modeller. Hittills har utvecklarna kommit undan med sin webbskrapning mer eller mindre oskadda, men det har lett till stämningar och kontroverser. Nu kräver manusförfattarna i WritersSammanhang: ...Dessa hemsidor tillhandahåller undertexter i olika språk för filmer och serier, vilka kan användas ihop med framförallt piratkopierat material. En rapport från The Atlantic hävdade tidigare i år att Apple, Meta, Anthropic, Salesforce och Nvidia med flera använt undertexterna för att träna AI-modeller. ...
Omnämnda platser: Apple, Seinfeld, Breaking.
Google introducerar Gemini 2.0: en allomfattande AI-assistent
Google har nyss lanserat Gemini 2.0 som öppnar upp nya möjligheter för AI-agenter och multimodal AI. Gemini 2.0 närmar sig Googles vision för en ”allomfattande AI-assistent”. Utvecklare och betatestare kan testa Gemini 2.0 med start idag. Därefter kommerSammanhang: ...Gemini 2.0 har gjort att Project Astra bättre kan förstå dialekter, ovanliga ord och samtal på flera olika språk samtidigt. Tack vare 2.0 kan Astra även använda sökmotorn, Lens och Maps på egen hand eller åt användaren. ...
Omnämnda personer: Gemini Advanced.
Google fortsätter göra reklam för röstsamtal med Gemini
Google verkar anse att Gemini Live är en attraktiv funktion och har släppt en hel serie reklamfilmer för röstsamtal med assistenten. Första annonsen blev smått viral och är nu uppe i 12 miljoner visningar. Senaste snutten visar hur två personer diskuterarSammanhang: ...Gemini Live krävde till en början en prenumeration men kan nu användas av alla på engelska och flera andra språk (men inte svenska). Användare kan välja mellan tio olika kvinnliga och manliga röster. Några som inte bryr sig om Oxford-kommat är för övrigt Vampire Weekend. ...
Omnämnda platser: George. Omnämnda personer: George and Sarah, Gemini Live, Vampire Weekend.