Vonesa e modelit gjigant të AI-së së Meta-s tregon vështirësitë për t’u përshtatur me paradigmën e re

foto

Meta ka shtyrë publikimin e modelit të saj më të madh të inteligjencës artificiale, me emrin e koduar “Behemoth”, duke e vonuar lançimin për një kohë të pacaktuar për shkak të dyshimeve të brendshme rreth aftësive të tij dhe tensioneve në rritje brenda kompanisë.

foto

Modeli masiv i gjuhës fillimisht ishte planifikuar të lançohej në prill për të përkuar me konferencën e parë të zhvilluesve të Meta-s, LlamaCon. Në vend të kësaj, Meta ka publikuar vetëm dy modele më të vogla nga familja Llama deri më tani. Lansimi i Behemoth u shty fillimisht për në qershor dhe tani është shtyrë për në vjeshtë ose më vonë, sipas raportimeve nga Wall Street Journal.

foto

Njerëz të njohur me projektin thonë se ekipet inxhinierike të Meta-s kanë hasur vështirësi në ofrimin e përmirësimeve domethënëse në krahasim me versionet e mëparshme. Si rezultat, brenda kompanisë po rritet skepticizmi nëse modeli i ri është gati për lançim publik. Disa zhvillues janë të shqetësuar se performanca e Behemoth në botën reale nuk do të jetë në lartësinë e pretendimeve publike të Meta-s për superioritetin e tij ndaj modeleve konkurruese nga OpenAI, Google ose Anthropic.

Sipas raportit, udhëheqja e Metës është gjithnjë e më e frustruar me ekipin që qëndron pas modeleve Llama 4 dhe po shqyrton një riorganizim brenda grupit të produkteve të inteligjencës artificiale. Një zëdhënës i Metës nuk pranoi të komentonte për Wall Street Journal.

Kompania është përballur me pengesa edhe më parë. Dy modelet Llama të lançuara në prill fillimisht performuan mirë në një tabelë të njohur të chatbot-eve të inteligjencës artificiale, por më vonë doli që Meta kishte paraqitur një version të përshtatur posaçërisht për testin benchmark – jo për publikimin publik. Mark Zuckerberg pranoi se modeli i testuar ishte optimizuar posaçërisht për testin.

Sfidat e Meta-s nuk janë unike. Fillimisht, OpenAI planifikoi të lançonte GPT-5 deri në mesin e vitit 2024, por në shkurt, CEO Sam Altman njoftoi se GPT-4.5 do të vinte i pari, me GPT-5 që pritet më vonë gjatë vitit, dhe se do të shkëputej nga formati tradicional i modelit të gjuhës së madhe. Anthropic gjithashtu ka hasur pengesa: modeli i saj më i madh, Claude 3.5 Opus, nuk u publikua kurrë. Në vend të kësaj, të dy kompanitë – së bashku me Google dhe xAI – tani po përqendrohen në modelet hibride të arsyetimit, të cilat kanë treguar përparim të qartë krahasuar me paraardhësit e tyre në teste të shumta. Deri më tani, Meta duket se e ka humbur këtë ndryshim në qasje.