Musk njofton lançimin e Grok 4.5, duke thënë se është po aq i mirë, në mos më i mirë, se Claude Opus i Anthropic
Grok 4.5 është lëshuar për testim privat beta dhe Elon Musk është i bindur se performanca e këtij modeli është në të njëjtin nivel me, ose potencialisht e tejkalon, modelin kryesor të Anthropic.
Musk ka zbuluar detaje të reja rreth modelit më të fuqishëm të inteligjencës artificiale të xAI deri më sot.
Duke postuar në platformën e tij të mediave sociale X, Musk tha se Grok 4.5, i cili është trajnuar në modelin themelor 1.5T V9 të xAI, po testohet brenda kompanisë së tij, SpaceX dhe Tesla.
Musk ka publikuar Grok 4.5 në një beta private, që do të thotë se do të testohet brenda kompanive të tij për të përmirësuar gabimet dhe problemet e mundshme me modelin derisa të jetë gati për publikun.
xAI përdor një teknikë të të mësuarit automatik të quajtur të mësuarit përforcues, e cila imiton metodën njerëzore të provës dhe gabimit, duke synuar të zhvillojë modele të IA-së që marrin vendimin më të mirë të mundshëm bazuar në nxitjen.
Kjo metodë, e shoqëruar me agjentin e kodimit Grok Build të xAI, duhet të “përmirësojë ndjeshëm modelin”, pasi si Grok 4.5 ashtu edhe Grok Build bëhen “më të mirë çdo ditë”, sipas postimit të Musk.
Musk përmendi gjithashtu se Grok 4.5 përdori të dhënat e Kursorit, të cilat u shtuan në trajnimin plotësues.
Cursor, platforma e kodimit të inteligjencës artificiale e blerë nga Musk për 60 miliardë dollarë, u përdor për të ndihmuar në trajnimin e Grok 4.5 më vonë në zhvillimin e modelit.
Vlerësimet e hershme të Grok 4.5 tregojnë se modeli tregon se performanca e tij është “afër (ose) ndoshta më e lartë se Opus”, pohon Musk.
Opus, i cili përdoret nga kompani të mëdha si Shopify dhe Cursor, përdoret zakonisht për detyra të avancuara kodimi dhe punë njohurish, sipas Anthropic.
Modeli kryesor konsiderohet si ” modeli më i aftë i nivelit Opus të Anthropic për arsyetim kompleks dhe kodim agjentik” dhe konsiderohet si modeli më i fuqishëm i konsumatorit i kompanisë.

Anthropic prezantoi Opus 4.8 një muaj më parë, dhe një rishikim i dukshëm i modelit përfshinte aftësinë e tij për të qenë i sinqertë.
“Një nga përmirësimet më të spikatura në Opus 4.8 është ndershmëria e tij. Ne i trajnojmë të gjitha modelet tona që të jenë të ndershme, për shembull, për të shmangur bërjen e pretendimeve që nuk mund t’i mbështesin”, tha Anthropic.
Meqenëse modelet e inteligjencës artificiale janë makina njohjeje të modeleve dhe nuk kanë kontekst të botës reale, ato kanë tendencë të “nxjerrin në përfundime të nxituara” dhe të bëjnë pretendime bindëse, ndërkohë që ka prova të kufizuara për të mbështetur gjetjet e tyre.

Vlerësimet e brendshme të Anthropic matën për halucinacione faktike dhe zbuluan se Opus 4.8 kishte “shkallën më të ulët të pasaktësive” nga të gjitha 6 modelet.
“Opus 4.8 e arriti këtë duke refuzuar t’u përgjigjej pyetjeve për të cilat ishte i pasigurt, në vend që t’u përgjigjej saktë më shumë pyetjeve”, zbuloi Anthropic.
Grok u zhvillua për të rivalizuar ChatGPT të OpenAI dhe u projektua të ishte një rrëfyes i së vërtetës rebel, por i ndershëm.
Ndërsa skandale të ndryshme, duke përfshirë lavdërimet e Grok për Adolf Hitlerin , “gjenocidin e të bardhëve në Afrikën e Jugut” , krijimin e fotove nudo të rreme nga Grok , ndalimet qeveritare dhe përdorimin rastësor të fyerjeve në gjuhën hindi, njollosën zhvillimin e modeles, xAI vazhdoi të pohonte se Grok është i ndershëm dhe ka më pak të ngjarë të ketë halucinacione sesa modelet e saj të mëparshme.
Krahasimi i Grok 4.5 me Opus nga Musk sugjeron që modeli beta privat do të ndjekë parime të ngjashme me Anthropic.
Ndërsa produktet e Musk, përkatësisht Grok, janë shqyrtuar me kujdes nga ligjvënësit dhe publiku për shumë nga arsyet e përmendura më sipër, ndershmëria është me sa duket një parim thelbësor i markës personale dhe profesionale të Musk.
Një zhvillues i pavarur, superfans i Musk dhe krijues i llogarisë Muskosophy e ka pozicionuar miliarderin e teknologjisë si një person jashtëzakonisht të ndershëm.
Në një postim në X, Muskosophy ndau filozofinë e Muskut mbi ndershmërinë dhe të vërtetën, duke thënë se ai beson se e vërteta objektive dhe ndershmëria janë të nevojshme për të zhbllokuar misteret e universit.

“Nëse nuk je rigorozë në lidhje me të vërtetën dhe ndershmërinë, do të jetosh në një botë të mashtruar dhe nuk do ta kuptosh natyrën e realitetit”, tha Musk.
Drejtori ekzekutiv i SpaceX iu përgjigj këtij postimi, duke thënë se qëndrimi i tij ndaj jetës “është e vetmja mënyrë”.
Ky qëndrim është i pasqyruar në shumicën e produkteve të Musk, me X të pozicionuar si një “shesh qyteti dixhital” ku përdoruesit mund të verifikojnë faktet e postimeve duke përdorur Shënimet e Komunitetit.
Megjithatë, X është kritikuar prej kohësh si një flluskë komode për konservatorët e krahut të djathtë, me studime që përforcojnë argumentin se algoritmet X i japin përparësi përmbajtjes konservatore dhe ndikojnë opinionet drejt së djathtës politike.
Musk krijoi gjithashtu Grokipedia, një alternativë ndaj Wikipedia-s, e cila gjithashtu pretendonte se promovonte ndershmërinë dhe transparencën kur kërkohej informacion në internet.
Grokipedia pozicionohet si “burimi më i madh dhe më i saktë i njohurive në botë pa kontroll të centralizuar” dhe u krijua për të zgjidhur problemet brenda paragjykimeve editoriale të Wikipedia-s.
DogeDesigner, i cili funksionon pothuajse si një llogari fansash e Elon Musk, pretendon se Grokipedia është një antidot ndaj paragjykimeve të krahut të majtë të Wikipedia-s dhe pretendon se platforma “shpesh përdoret si një mjet propagande, jo si një enciklopedi e paanshme”.
Megjithatë, Grokipedia përdor Grok për të vendosur se cilat informacione të përfshijë dhe cilat të dhëna janë të sakta ose të pasakta.
Meqenëse shumë nga produktet e Musk bazohen në Grok, i cili është trajnuar mbi një larmi të gjerë të dhënash, duke përfshirë postimet X, ndjekja e rrezikshme e së vërtetës nga ish-trilioneri mund të pengohet nga dezinformimi dhe ideologjitë e ekstremit të djathtë që përhapen në të gjithë platformën e tij.
Kohët e fundit, ish-inxhinieri i xAI, Devin Kim, u shkarkua nga kompania pasi kërkoi që Grok të zhvillohej me masa mbrojtëse më të forta.
xAI dështoi të prioritizonte sigurinë e IA-së kur zhvilloi Grok, gjë që “pothuajse garantonte që kompania do të kryente akte të paligjshme”.
Pa këto masa mbrojtëse, Grok ka të ngjarë të inkurajojë diskriminimin dhe t’u mësojë përdoruesve se si të zhvillojnë armë të shkatërrimit në masë.
