Mistral AI publikon vlerësimin e parë gjithëpërfshirës të ciklit të jetës së një modeli të madh gjuhësor

foto

Mistral AI ka publikuar atë që e quan vlerësimin e parë gjithëpërfshirës të ciklit jetësor të një modeli të madh gjuhësor, duke synuar të vendosë standarde të reja për transparencën në industri.

foto

Raporti përqendrohet në modelin kryesor të Mistral, Mistral Large 2, dhe detajon kostot mjedisore si të trajnimit ashtu edhe të 18 muajve të funksionimit. Deri në janar, modeli kishte gjeneruar 20.4 kilotonë ekuivalentë CO₂, kishte konsumuar 281,000 metra kub ujë dhe kishte përdorur burime ekuivalente me 660 kilogramë antimon. (Ekuivalentët e antimonit përdoren për të matur konsumin e metaleve dhe mineraleve të rralla të nevojshme për prodhimin e pajisjeve.)

Për ta vënë në perspektivë, ekipi llogariti ndikimin e një përgjigjeje të vetme prej 400 shenjash nga asistenti Le Chat i Mistral: çdo kërkesë çoi në 1.14 gramë ekuivalentë CO₂, 45 mililitra ujë dhe 0.16 miligramë ekuivalentë antimoni.

foto

Drejtori ekzekutiv i OpenAI, Sam Altman, kohët e fundit deklaroi se një kërkesë mesatare ChatGPT përdor vetëm 0.32 mililitra ujë, që është më pak se një e qindta e shifrës së Mistral. Megjithatë, meqenëse OpenAI nuk ka publikuar një ndarje transparente të ndikimit të saj në mjedis dhe Altman e përmendi statistikën vetëm kalimthi, është e paqartë se sa të krahasueshme janë shifrat.

Raporti i Mistral thekson se kërkesat masive llogaritëse të IA-së gjeneruese – shpesh që funksionojnë në grupe GPU në rajone me energji elektrike të rëndë karboni dhe ndonjëherë nën presion uji – lënë një gjurmë të rëndësishme mjedisore. Ky nuk është një zbulim i ri, por shkalla është rritur së bashku me bumin e vazhdueshëm të IA-së.

Studimi tregon gjithashtu një lidhje të qartë midis madhësisë së modelit dhe gjurmës mjedisore. Sa më i madh të jetë modeli, aq më i madh është ndikimi: një model që është dhjetë herë më i madh ka një kosto mjedisore afërsisht një rend madhësie më të lartë, duke supozuar të njëjtin numër tokenësh të gjeneruar. Kjo nënvizon nevojën për të zgjedhur modelin e duhur për secilin rast përdorimi.

Bazuar në gjetjet e saj, Mistral sugjeron që industria të miratojë tre metrika kryesore: ndikimin total të trajnimit të modelit, ndikimin për çdo përfundim (për kërkesë) dhe raportin e përfundimit ndaj ndikimit të përgjithshëm të ciklit jetësor.

Mistral argumenton se dy pikat e para të të dhënave duhet të jenë të detyrueshme për t’i dhënë publikut një kuptim më të mirë të efekteve mjedisore të inteligjencës artificiale. E treta mund të shërbejë si një metrikë e brendshme, me zbulim publik opsional, për të ofruar një pamje më të plotë të ciklit jetësor.

Kompania sheh dy mënyra për të zvogëluar gjurmën mjedisore të IA-së. Së pari, kompanitë e IA-së duhet të publikojnë ndikimin mjedisor të modeleve të tyre duke përdorur standarde të njohura ndërkombëtarisht, duke ua bërë më të lehtë përdoruesve të krahasojnë dhe zgjedhin opsione më ekologjike. Së dyti, vetë përdoruesit mund të ndihmojnë duke përdorur IA-në gjeneruese në mënyrë më efikase – duke zgjedhur modelin e duhur për nevojat e tyre, duke i bashkuar kërkesat dhe duke shmangur llogaritjet e panevojshme. Mistral gjithashtu sugjeron që institucionet publike mund ta shtyjnë tregun në një drejtim më ekologjik duke marrë në konsideratë efikasitetin dhe madhësinë e modeleve në vendimet e tyre të prokurimit.