Google I/O 2025: AI forradalom Gemini 2.5-tel, Imagen 4-gyel és a filmes Flow eszközzel

A Google I/O 2025 esemény igazán nagyszabásúra sikerült, főként a mesterséges intelligenciára fókuszálva.

írta Smarteast.hu

2025-05-21

Megosztás:

A Google I/O 2025 esemény igazán nagyszabásúra sikerült, főként a mesterséges intelligenciára fókuszálva. A vállalat bemutatta a Gemini 2.5 modelleket (Pro és Flash), az újgenerációs Imagen 4 képgenerálót és a Veo 3 AI videógenerátort. Emellett leleplezte a Flow nevű filmes AI-eszközt is, amely az Imagen, Veo és Gemini képességeit ötvözve képes egyszerű szöveges utasításokból moziszerű jeleneteket létrehozni.

A Gemini 2.5 több mint 24 nyelvet támogat szövegfelolvasással és kifejező hangokkal. A Google jelentős fejlesztéseket ígér az érvelési képességek, multimodalitás, kódolás és hosszú szövegkörnyezetek értelmezése terén. A Gemini Pro modell új funkciója a Deep Think nevű érvelési mód, amely bonyolult matematikai és programozási feladatok megoldására szolgál. Ez egyelőre kísérleti fázisban van, és hamarosan csak megbízható tesztelők számára lesz elérhető. A Deep Think funkció képes több lehetséges válaszlehetőséget mérlegelni a végső válasz előtt.

A Gemini 2.5 Pro most vezeti a WebDev Arena és az LMArena AI benchmarkokat. Továbbfejlesztett kódolási és webalkalmazás-fejlesztési eszközöket kínál, és akár 1 millió tokenes szövegablakot is képes értelmezni. Emellett javult a védelem az indirekt prompt-injekciók ellen. A Gemini 2.5 Flash előnézeti verziója már elérhető a Gemini appban, míg a végleges verzió június végén érkezik. A Gemini 2.5 Pro kereskedelmi verziója ezt követően lesz elérhető.

Az Imagen 4 akár 2K felbontású képek generálására is képes. A Google szerint pontosabb szövegeket tud megjeleníteni plakátokon, kártyákon és képregényekben. Az Imagen 4 már mostantól elérhető a Gemini, Google Workspace, Whisk és Vertex AI alkalmazásokban.

A Veo 3 a Google legújabb AI videómodellje, amely jobb szöveg-felismerést biztosít a videógenerálásnál. Képes hanggal, párbeszéddel és háttérzajokkal ellátott videók készítésére. A Veo 3 azonnal elérhető az amerikai Google AI Ultra előfizetők és a Vertex AI vállalati ügyfelek számára. A Veo 2 mostantól támogat kameramozgásokat, objektumok hozzáadását és eltávolítását, valamint képek stílusirányításra történő használatát és a képkockák kibővítését az eredeti határokon túl.

A Flow a Google új filmes AI-eszköze, amely a Veo, Imagen és Lyria modellek képességeit ötvözi a részletgazdag, moziszerű jelenetek készítéséhez. A Google szerint a Flow segít a történetmesélőknek fizikailag realisztikus, kiemelkedő minőségű filmklipek létrehozásában. A felhasználók irányíthatják a kameramozgást, a szögeket és a perspektívát is, sőt, a korábban generált videókat is szerkeszthetik és bővíthetik. A Flow mostantól elérhető az amerikai Google AI Pro és Ultra előfizetők számára.

(via)

Utazz, böngéssz, spórolj – Saily eSIM

Nemzetközi mobilnet utazóknak, azonnali aktiválás, 5% kedvezmény! Próbáld ki a Saily eSIM-et, és élvezd a gondtalan netezést világszerte.

Fedezd fel a Saily-t

Állásfoglalásunk a szabad sajtó mellett

Hiszünk abban, hogy a szabad sajtó a demokratikus társadalom egyik alappillére – nemcsak a közéletben, hanem a kultúrában és technológia világában is. Egy sokszínű, szabad médiakörnyezet nemcsak az olvasóknak nyújt értéket, hanem bennünket is inspirál és erősít. Kiállunk amellett, hogy minden hangnak legyen tere és szabadsága – akkor is, ha szórakoztat, akkor is, ha kérdez, kritizál vagy vitát generál. Csak így születhet valódi párbeszéd – és csak így maradhatunk szabadok.