Elon Musk zbulon Grok 3

foto

Grok-3, i zhvilluar nga xAI i Elon Musk, u zbulua të hënën, me kompaninë duke bërë pretendime të guximshme në lidhje me aftësitë e saj, ndërsa shfaqi një infrastrukturë masive kompjuterike që sinjalizon ambicie edhe më të mëdha.

foto

Njoftimi u përqendrua shumë në muskujt e papërpunuar llogaritës, performancën standarde dhe veçoritë e ardhshme, megjithëse shumë nga demonstrimet aktuale duken si përsëritje të asaj që kompanitë e tjera të AI kanë arritur tashmë.

Ylli i pjesës fillestare të shfaqjes nuk ishte vetë AI, por “Colossus”, një grup gjigant prej 200,000 GPU që fuqizon trajnimin e Grok-3.

Sistemi u bashkua në dy faza: 122 ditë trajnim sinkron në 100,000 GPU, të ndjekura nga 92 ditë shkallëzim deri në 200,000 të plota. Sipas zhvilluesve të xAI, ndërtimi i kësaj infrastrukture doli më sfidues sesa zhvillimi i vetë modelit të AI.

Kompania tashmë ka plane për një grup edhe më të fuqishëm, me Musk duke thënë se ata po synojnë pesëfishin e kapacitetit aktual, duke ndërtuar në mënyrë efektive atë që do të ishte grupi më i fuqishëm GPU në tokë.

foto

Kur bëhet fjalë për performancën, Grok-3 tregon rezultate mbresëlënëse në standardet standarde të AI. Modeli bazë (modeli i rregullt pa zinxhirin e mendimit dhe arsyetimin e integruar) kryeson vazhdimisht grafikët në testet e matematikës (AIME), shkencës (GPOA) dhe kodimit (LCB).

Duket shumë premtuese edhe në testet e verbër.

xAI konfirmoi se modeli misterioz i koduar “Chocolate” ishte në fakt një version i hershëm i testimit të Grok-3 që u ngarkua në LLM Arena.

Gjatë atyre testeve, ai arriti ELO-n më të mirë midis të gjitha LLM-ve, që do të thotë se përdoruesit preferuan përgjigjet e tij mbi gjeneratat e ofruara nga të gjitha modelet e tjera të AI në konkurrencë të drejtpërdrejtë pa e ditur se cilin model po vlerësonin.

Kjo është ndoshta mënyra më e saktë për të matur cilësinë pa u dhënë modeleve ndonjë shans për të mashtruar në standardet duke trajnuar AI-të e tyre në ato grupe të dhënash. Ky pikë referimi bazohet thjesht në preferencën dhe zgjedhjen e verbër nga mijëra përdorues anonimë.

Një variant i specializuar “Reasoning Beta” i Grok-3, i cili përdor përpunim të brendshëm të zinxhirit të mendimit dhe llogaritje shtesë në kohën e testimit, i shtyn rezultatet e matematikës edhe më të larta – duke arritur 93% në standardin AIME 2025 krahasuar me modelet e tjera me performancën më të mirë që renditen nën 87%.

Është interesante se një version më i vogël i quajtur Grok-3 Mini Reasoning Beta ndonjëherë e tejkalon motrën e tij më të madhe, falë një kohe më të gjatë trajnimi.

Me fjalë të tjera, Grok-3 me madhësi të plotë ka ende vend për përmirësim pasi të ketë kohëzgjatje të krahasueshme të trajnimit, e cila duket premtuese duke pasur parasysh numërimin e tij më të madh të parametrave.

Por kur xAI u zhvendos për të demonstruar aftësitë e Grok-3 drejtpërdrejt, prezantimi u duk më shumë si një lojë e kapjes sesa risi. Ekipi shfaqi modelin që zgjidh problemet e fizikës dhe shkruan kodin e lojës nga e para – bëmat mbresëlënëse që ChatGPT, Claude dhe Gemini i Google i zotëruan pak kohë më parë.

Ata prezantuan gjithashtu DeepSearch, një agjent kërkimor që, si mjete të ngjashme nga OpenAI dhe Google, pastron ueb-in dhe gjeneron raporte të gjera për tema të caktuara.

Abonentët e X Premium Plus marrin akses të menjëhershëm në Grok-3, por versioni më i fuqishëm dhe versionet e përditësuara zakonisht do të jetojnë në një aplikacion të veçantë të dedikuar ose në Grok.com.

Ndërveprimet zanore, të ngjashme me ” Avanced Voice Mod e” të OpenAI-t do të mbërrijnë në javët e ardhshme, me Musk duke theksuar se kjo nuk është e thjeshtë tekst në të folur, por një model zëri i vërtetë i AI, i aftë për të folur natyral dhe shprehës.

Zhvilluesit do të kenë akses në API në javët e ardhshme, së bashku me aftësitë e transkriptimit audio, duke e bërë Grok-3 një mjet të fuqishëm për aplikacionet e palëve të treta me AI.

Vetëm pasi shfaqi një shembull të një loje Tetris të krijuar nga Grok, xAI zbuloi gjithashtu planet për një studio lojrash me AI që do t’i lejojë zhvilluesit të ndërtojnë lojëra të mundësuara nga Grok-3.

Tani për tani, modeli po shfaqet ngadalë. Deri në kohën e shkrimit, Decrypt nuk ka marrë ende akses në model, por disa entuziastë e kanë provuar atë dhe deri më tani janë të kënaqur me rezultatet.

Shkencëtari kompjuterik Lex Friedman, një nga zërat më të lartë në hapësirën e AI, vlerësoi aftësitë e Grok-3.

Të tjerë e krahasuan atë me rivalët kryesorë të tregut.

“Grok 3 + Thinking ndihet diku rreth territorit të gjendjes së artit të modeleve më të forta të OpenAI (o1-pro, 200 dollarë/muaj) dhe pak më mirë se DeepSeek-R1 dhe Gemini 2.0 Flash Thinking,” shkroi ish-bashkëthemeluesi i OpenAI Andrej Karpathy në një postim të gjerë në X. vrull”

Përdoruesi X Penny2x ndau një lojë të ndërtuar nga e para me Grok-3 – një platformer 2d i ngjashëm me Mario Bros.

Ata dukeshin të impresionuar nga aftësia e Grokut për të kuptuar udhëzimet dhe për të përmirësuar pas disa përsëritjesh.

“Unë thjesht vazhdoj të kërkoj rregullime, dhe ai vazhdon të pështyjë lojën në një skedar të vetëm që mund ta vendos në desktopin tim dhe ta ekzekutoj.” ai ka shkruar në një postim në X. “Kjo është e pabesueshme. Ne jetojmë në të ardhmen. Të gjithë janë zhvillues tani.”

Loja është në dispozicion për testim në Thank Doge.

Kompania konfirmoi gjithashtu planet për të hapur Grok-2 me burim të hapur pasi Grok-3 të jetë plotësisht i pjekur dhe të funksionojë siç duhet, gjë që pritet të ndodhë diku në muajt e ardhshëm.

xAI më parë i kishte me burim të hapur modelet e tij pas Grok-2, duke vazhduar trendin e lëshimit të versioneve më të vjetra për të nxitur inovacionin—ndonëse Grok-2 mbetet pas modeleve të nivelit të lartë.

Tani për tani, Grok-3 duket i aftë për të përputhur atë që modelet më të mira të AI tashmë mund të bëjnë.

Testi i vërtetë do të vijë kur xAI të nxjerrë në treg veçoritë e premtuara të zërit, mjetet e lojërave dhe aksesin në API në javët në vijim. Tani, topi është në fushën e OpenAI, i cili do të publikojë së shpejti GPT-4.5.