Vonesa e modelit gjigant të AI-së së Meta-s tregon vështirësitë për t’u përshtatur me paradigmën e re

Meta ka shtyrë publikimin e modelit të saj më të madh të inteligjencës artificiale, me emrin e koduar “Behemoth”, duke e vonuar lançimin për një kohë të pacaktuar për shkak të dyshimeve të brendshme rreth aftësive të tij dhe tensioneve në rritje brenda kompanisë.

Modeli masiv i gjuhës fillimisht ishte planifikuar të lançohej në prill për të përkuar me konferencën e parë të zhvilluesve të Meta-s, LlamaCon. Në vend të kësaj, Meta ka publikuar vetëm dy modele më të vogla nga familja Llama deri më tani. Lansimi i Behemoth u shty fillimisht për në qershor dhe tani është shtyrë për në vjeshtë ose më vonë, sipas raportimeve nga Wall Street Journal.

Njerëz të njohur me projektin thonë se ekipet inxhinierike të Meta-s kanë hasur vështirësi në ofrimin e përmirësimeve domethënëse në krahasim me versionet e mëparshme. Si rezultat, brenda kompanisë po rritet skepticizmi nëse modeli i ri është gati për lançim publik. Disa zhvillues janë të shqetësuar se performanca e Behemoth në botën reale nuk do të jetë në lartësinë e pretendimeve publike të Meta-s për superioritetin e tij ndaj modeleve konkurruese nga OpenAI, Google ose Anthropic.

Sipas raportit, udhëheqja e Metës është gjithnjë e më e frustruar me ekipin që qëndron pas modeleve Llama 4 dhe po shqyrton një riorganizim brenda grupit të produkteve të inteligjencës artificiale. Një zëdhënës i Metës nuk pranoi të komentonte për Wall Street Journal.

Kompania është përballur me pengesa edhe më parë. Dy modelet Llama të lançuara në prill fillimisht performuan mirë në një tabelë të njohur të chatbot-eve të inteligjencës artificiale, por më vonë doli që Meta kishte paraqitur një version të përshtatur posaçërisht për testin benchmark – jo për publikimin publik. Mark Zuckerberg pranoi se modeli i testuar ishte optimizuar posaçërisht për testin.

Sfidat e Meta-s nuk janë unike. Fillimisht, OpenAI planifikoi të lançonte GPT-5 deri në mesin e vitit 2024, por në shkurt, CEO Sam Altman njoftoi se GPT-4.5 do të vinte i pari, me GPT-5 që pritet më vonë gjatë vitit, dhe se do të shkëputej nga formati tradicional i modelit të gjuhës së madhe. Anthropic gjithashtu ka hasur pengesa: modeli i saj më i madh, Claude 3.5 Opus, nuk u publikua kurrë. Në vend të kësaj, të dy kompanitë – së bashku me Google dhe xAI – tani po përqendrohen në modelet hibride të arsyetimit, të cilat kanë treguar përparim të qartë krahasuar me paraardhësit e tyre në teste të shumta. Deri më tani, Meta duket se e ka humbur këtë ndryshim në qasje.

Tags: AI, Anthropic, Artificial Intelligence, Behemoth, Google, kuriozitete, lajme, lajme shqip, lajmet e dites, lajmet e fundit, Llama, LlamaCon, Meta, OpenAI, Wall Street Journal

Vonesa e modelit gjigant të AI-së së Meta-s tregon vështirësitë për t’u përshtatur me paradigmën e re

Mistral AI siguron 830 milionë dollarë borxh për të ngritur një qendër të dhënash pranë Parisit

DeepSeek i Kinës pëson një ndërprerje të rrallë që zgjat disa orë

Pse OpenAI në të vërtetë e mbylli Sora

Mistral AI siguron 830 milionë dollarë borxh për të ngritur një qendër të dhënash pranë Parisit

DeepSeek i Kinës pëson një ndërprerje të rrallë që zgjat disa orë

Eli Lilly and Company bën një bast prej 2.75 miliardë dollarësh në zbulimin e barnave të fuqizuar nga AI

Dyqani i aplikacioneve të ChatGPT has në vështirësi gjashtë muaj pas lançimit

Microsoft Copilot tani po fut reklama në pull request-et në GitHub

Siri i Apple mund të marrë një dyqan aplikacionesh AI të vetin

You may have missed

Mistral AI siguron 830 milionë dollarë borxh për të ngritur një qendër të dhënash pranë Parisit

DeepSeek i Kinës pëson një ndërprerje të rrallë që zgjat disa orë

Eli Lilly and Company bën një bast prej 2.75 miliardë dollarësh në zbulimin e barnave të fuqizuar nga AI

Dyqani i aplikacioneve të ChatGPT has në vështirësi gjashtë muaj pas lançimit

Microsoft Copilot tani po fut reklama në pull request-et në GitHub

More Stories

You may have missed