Elon Musk xAI vállalata bemutatta legújabb mesterséges intelligencia modelljét, a Grok 3-at, amely állításuk szerint felülmúlja az OpenAI GPT-4.0-t és a DeepSeek V3-at a matematika, tudomány és kódolás területén.
A Grok 3 egy korai verziója a Chatbot Arena teszteken is az első helyre került – ez egy olyan platform, ahol a felhasználók úgy értékelik a chatbotokat, hogy közben nem tudják, melyikkel beszélgetnek éppen. A Grok 3 jelentős előrelépést képvisel elődjéhez képest, hiszen tízszer nagyobb számítási kapacitással rendelkezik, köszönhetően az xAI memphisi adatközpontjának, amely mintegy 200 ezer GPU-t foglal magában. Ez a megnövekedett teljesítmény lehetővé teszi a modell számára, hogy összetett matematikai és tudományos problémákat oldjon meg, valamint fejlett kódolási feladatokat hajtson végre.
Az új modell egyik kiemelkedő tulajdonsága az érvelési képesség. A Grok 3 „Think” és „Big Brain” módokat kínál, amelyek lehetővé teszik a felhasználók számára, hogy nyomon kövessék a modell gondolkodási folyamatát, illetve összetettebb problémák esetén további számítási erőforrásokat vegyenek igénybe a pontosabb válaszok érdekében. Van benne az OpenAI deep research funkciójához hasonló megoldás is, ami az internetet és az X platformot is átfésüli részletes információkért. A Grok 3 része az Aurora képgenerátor, egy beépített képalkotó funkció, ami a tesztek szerint jó minőségű képeket készít, így a Geminihez és a ChatGPT-hez hasonlóan már képeket is képes létrehozni szöveges utasítás alapján.
A modell teljesítményét több teszten mérték, mint például az AIME ’24 (matematika), a GPQA (PhD-szintű természettudományos kérdések) és az LCB (programozás). A Grok 3 jelenleg az X Premium+ előfizetők számára érhető el havi negyven dolláros díj ellenében, míg a fejlettebb funkciók a SuperGrok csomag részeként havi harminc dollárért vagy éves háromszáz dollárért állnak rendelkezésre. Az xAI tervei között szerepel a Grok 2 nyílt forráskódúvá tétele a következő hónapokban, valamint a Grok alkalmazás hangalapú funkcióval való bővítése, amely szintetikus hangot biztosít a modellek számára.
Összefoglalás
- A Grok 3 egy korai verziója a Chatbot Arena teszteken is az első helyre került – ez egy olyan platform, ahol a felhasználók úgy értékelik a chatbotokat, hogy közben nem tudják, melyikkel beszélgetnek éppen.
- A Grok 3 „Think” és „Big Brain” módokat kínál, amelyek lehetővé teszik a felhasználók számára, hogy nyomon kövessék a modell gondolkodási folyamatát, illetve összetettebb problémák esetén további számítási erőforrásokat vegyenek igénybe a pontosabb válaszok érdekében.
- A Grok 3 része az Aurora képgenerátor, egy beépített képalkotó funkció, ami a tesztek szerint jó minőségű képeket készít, így a Geminihez és a ChatGPT-hez hasonlóan már képeket is képes létrehozni szöveges utasítás alapján.