Sortera på relevans Sorterad på datum
Resultat 1 - 1 av 1

OpenAI introducerar GPT-4o som kan tolka ljud, bild och text i realtid

OpenAI har nyss presenterat sin senaste och mest avancerade språkmodell GPT-4o som kan tolka ljud, bild och text i realtid (något Google nyss visade att Gemini klarar). Tillägget av bokstaven ”o” i namnet på språkmodellen står för ”omni”. Enligt utvecklaren

Sammanhang: ...Tillägget av bokstaven ”o” i namnet på språkmodellen står för ”omni”. Enligt utvecklaren kan modellen svara på ljudinput på bara 232 millisekunder med ett snitt på 320 millisekunder, vilket ska likna mänsklig svarstid under samtal. ...

swedroid.se - https://swedroid.se/...i-realtid/ - 1150 - Datum: 2024-05-13 20:18. - Leta efter artikeln på Archive.today »