Az Új AI Király? Ingyenes Google Gemini 2.5 Pro

By Sandor 26/03/2025

Az Új AI Király? Ingyenes Google Gemini 2.5 Pro

Az eddigi legokosabb mesterséges intelligencia?

A Google DeepMind ismét magasabbra tette a lécet a mesterséges intelligencia (MI) világában a Gemini 2.5 bejelentésével, amelyet 2025.[1] március 25-én mutattak be.[2][3][4][5][6][7] Az új modellcsalád első tagja, a Gemini 2.5 Pro (pontosabban jelenleg a „Gemini 2.5 Pro Experimental” nevű kísérleti verzió) a cég eddigi legintelligensebb MI modelljeként debütált, ígéretes képességekkel a komplex problémamegoldás, a kódolás és a multimodális feladatok terén.

Mit tud a Gemini 2.5 Pro?

A Gemini 2.5 az előző generációk (Gemini 1.0 és 1.5) erősségeire épít, mint például a natív multimodalitás (kép, hang, videó, szöveg és kód egyidejű feldolgozása) és a hatalmas kontextusablak. A 2.5 Pro már az induláskor 1 millió tokenes kontextusablakkal rendelkezik, ami hamarosan 2 millióra bővül.[2][3][5][8] Ez azt jelenti, hogy a modell képes hatalmas adatmennyiségeket – például akár egy órányi videót, több tízezer sornyi kódot vagy több száz oldalas dokumentumokat – egységként értelmezni és komplex összefüggéseket feltárni bennük.[9]

Az igazi újdonság azonban a „gondolkodási” képesség bevezetése.[5] A Google szerint a Gemini 2.5 modellek képesek „végiggondolni a gondolataikat”, mielőtt választ adnának.[3][5][6] Ez a lépésenkénti problémamegoldást és a belső következtetési láncok finomítását jelenti, ami jobb teljesítményt és nagyobb pontosságot eredményez, különösen összetett feladatoknál.[2][3][5][7] Ez a megközelítés hasonlít az emberi gondolkodáshoz, ahol egy komplex kérdésre nem azonnal vágjuk rá a választ, hanem végigelemezzük a lehetőségeket.[1]

Teljesítmény és összehasonlítás más modellekkel

A Google szerint a Gemini 2.5 Pro Experimental jelentős előnnyel vezeti az LMArena ranglistát, amely az emberi preferenciákat méri, jelezve, hogy a felhasználók jobbnak és stílusosabbnak ítélik a válaszait más modellekhez képest.[5] Kiemelkedő eredményeket mutat a matematikai (pl. AIME 2025), tudományos (pl. GPQA) és kódolási (pl. SWE-bench) mérföldköveken is, gyakran felülmúlva az olyan vezető riválisokat, mint az OpenAI GPT-4 modelljei (pl. GPT-4o) és az Anthropic Claude 3 sorozata (pl. Opus, Sonnet). Különösen a tudományos érvelést mérő, rendkívül nehéz GPQA Diamond teszten ért el kiemelkedő, 84%-os eredményt, ahol más csúcsmodellek 60% alatt teljesítettek.[7]

Míg a GPT-4o és a Claude 3 Opus is rendkívül erősek a nyelvi feladatokban és a multimodális képességekben, a Gemini 2.5 Pro különösen az extrém hosszú kontextus kezelésében és az újonnan bevezetett „gondolkodási” képesség révén megkövetelt komplex érvelési feladatokban tűnik ki. Árban a korábbi Gemini 1.5 Pro a GPT-4 Turbónál és a Claude 3 Opusnál is kedvezőbb volt, a 2.5 Pro árképzését a Google a következő hetekben jelenti be.

Elérhetőség

A Gemini 2.5 Pro Experimental már elérhető a Google AI Studióban a fejlesztők számára, valamint a Gemini Advanced előfizetőknek a Gemini alkalmazáson keresztül (asztali és mobil verzióban is).[2] Hamarosan elérhetővé válik a Google Cloud Vertex AI platformján is, vállalati felhasználásra. Ez azt jelenti, hogy a legfejlettebb képességeket egyelőre a fizetős Gemini Advanced felhasználók és a fejlesztői közösség tagjai próbálhatják ki. Néhány újabb Samsung Galaxy eszköz (pl.[6] S25 széria) ingyenes Gemini Advanced próbaidőszakkal érkezhet, így ezek tulajdonosai is hozzáférhetnek.

Összegzés

A Gemini 2.5 Pro jelentős előrelépést képvisel a Google MI fejlesztéseiben. A megnövelt kontextusablak, a továbbfejlesztett multimodális képességek és különösen az újszerű „gondolkodási” mechanizmus révén képes lehet új szintre emelni a komplex problémamegoldást és az MI-asszisztensek hasznosságát. Bár még kísérleti fázisban van, a kezdeti eredmények és a benchmarkokon mutatott teljesítmény alapján komoly kihívója lehet a piacvezető modelleknek, és izgalmas új lehetőségeket nyithat mind a fejlesztők, mind a végfelhasználók számára.