Šie metai buvo kupini didelių dirbtinio intelekto (DI) naujovių, ir šią savaitę „Google“ paskelbė apie naują DI funkciją, kuri netrukus pasirodys mobiliuosiuose įrenginiuose. Ši naujiena pasirodė likus kelioms valandoms iki „Google I/O 2024“ renginio, kuriame tikimasi didelių pranešimų.
„Google“ socialiniame tinkle paviešino vaizdo įrašą, kuriame vartotojas klausia savo telefono apie tai, kas matoma per kamerą. Šiuo atveju telefonas atpažino, kad žmonės rengiasi „Google I/O“ scenai. Vartotojas ir telefonas tęsia realaus laiko pokalbį apie „Google I/O 2024“, o ekrane matoma jų pokalbio transkripcija. Nors daugiau informacijos neatskleidžiama, aišku, kad tai užuomina į būsimus pranešimus.
Atrodo, kad tai bus „Google Lens“ ir „Google Gemini“ technologijų derinys, tačiau su momentiniu veikimu. „Lens“ ir „Gemini“ jau gali analizuoti vaizdus, bet realaus laiko vaizdo įrašų analizė būtų naujovė.
Ši funkcija labai primena multimodalines funkcijas, kurias „OpenAI“ pademonstravo su savo „ChatGPT“ botu vakar. „ChatGPT“ dabar turi naują DI modelį, vadinamą GPT-4 Omni (GPT-4o), kuris leidžia natūraliai bendrauti dar lengviau.
Mes taip pat matėme panašią technologiją demonstruojamą su „Rabbit R1“ DI įrenginiu. Idėja yra ta, kad šie DI tampa mažiau kaip dėžutės, į kurias įvedate tekstą, ir labiau kaip sintetiniai žmonės, kurie gali matyti, atpažinti ir kalbėti.
Remiantis šia užuomina, atrodo, kad tai yra „Google Gemini“ DI modelio ir boto kryptis. Nors negalime identifikuoti išmaniojo telefono vaizdo įraše, gali būti, kad šios naujos funkcijos pirmiausia pasirodys „Pixel“ telefonuose (pavyzdžiui, naujajame „Google Pixel 8a“).
Visos naujienos bus atskleistos šiandien, gegužės 14 d.: renginys prasidės 10 val. PT / 13 val. ET / 18 val. BST, tai yra gegužės 15 d. 3 val. AEST. Mes parengėme vadovą, kaip stebėti „Google I/O 2024“ internetu, ir pranešime tiesiogiai iš renginio.