Inteligjenca artificiale me burim të hapur ngushton hendekun me drejtuesit e pronarit
Startup i inteligjencës artificiale Galileo lëshoi një standard gjithëpërfshirës të hënën duke zbuluar se modelet e gjuhëve me burim të hapur po e mbyllin me shpejtësi hendekun e performancës me homologët e tyre të pronarit. Ky ndryshim mund të riformësojë peizazhin e AI, duke demokratizuar potencialisht aftësitë e avancuara të AI dhe duke përshpejtuar inovacionin nëpër industri.
Indeksi i dytë vjetor i Halucinacioneve nga Galileo vlerësoi 22 modele të mëdha gjuhësore mbi prirjen e tyre për të gjeneruar informacion të pasaktë. Ndërsa modelet me burim të mbyllur ende kryesojnë në përgjithësi, marzhi është ngushtuar ndjeshëm në vetëm tetë muaj.
“Përmirësimet e mëdha në modelet me burim të hapur ishin absolutisht të pabesueshme për t’u parë,” tha Vikram Chatterji, bashkëthemelues dhe CEO i Galileo, në një intervistë me VentureBeat. “Në atë kohë [në tetor 2023] pesë ose gjashtë të parët ishin të gjithë modele API me burim të mbyllur, kryesisht modele OpenAI. Përkundrejt tani, burimi i hapur e ka mbyllur hendekun.”
Ky trend mund të ulë barrierat për hyrjen për startup-et dhe hulumtuesit, ndërkohë që u bën presion lojtarëve të vendosur që të inovojnë më shpejt ose të rrezikojnë të humbasin avantazhin e tyre.
Claude 3.5 Sonnet i Anthropic kryesoi indeksin si modeli me performancën më të mirë në të gjitha detyrat, duke tejkaluar ofertat nga OpenAI që dominuan renditjen e vitit të kaluar . Ky ndryshim tregon një ndryshim të rojes në garën e armatimeve të AI, me hyrjet më të reja që sfidojnë liderët e vendosur.
“Ne ishim jashtëzakonisht të impresionuar nga grupi më i fundit i modeleve të Anthropic,” tha Chatterji. “Jo vetëm që Sonnet ishte në gjendje të performonte shkëlqyeshëm në dritaret e kontekstit të shkurtër, të mesëm dhe të gjatë, duke shënuar një mesatare prej 0.97, 1 dhe 1 respektivisht në të gjitha detyrat, por mbështetja e modelit deri në një dritare konteksti 200 mijë sugjeron se mund të mbështeste edhe më të mëdha grupe të dhënash sesa kemi testuar.”
Indeksi theksoi gjithashtu rëndësinë e marrjes parasysh të efektivitetit të kostos së bashku me performancën e papërpunuar. Gemini 1.5 Flash i Google u shfaq si opsioni më efikas, duke dhënë rezultate të forta me një fraksion të çmimit të modeleve më të mira.
“Dollari për milion kushton prompt tokens për Flash-in ishte 0,35 dollarë, por ishte 3 dollarë për Sonet,” tha Chatterji për VentureBeat. “Kur shikoni rezultatin, kostoja e tokenit të përgjigjes në dollarë për milion, është rreth 1 dollarë për Flash, por është 15 dollarë për Sonet. Pra, tani kushdo që përdor Sonnet duhet të ketë menjëherë para në bankë, që është si, të paktën 15 deri në 20 herë më shumë, ndërsa fjalë për fjalë Flash nuk është aspak më keq.”
Kjo pabarazi kostoje mund të jetë thelbësore për bizneset që kërkojnë të përdorin inteligjencën artificiale në shkallë, duke nxitur potencialisht adoptimin e modeleve më efikase edhe nëse ato nuk janë në krye të grafikëve të performancës.
Qwen2-72B-Instruct i Alibaba-s performoi më së miri midis modeleve me burim të hapur, duke shënuar rezultate të larta në hyrjet me gjatësi të shkurtër dhe të mesme. Ky sukses sinjalizon një prirje më të gjerë të kompanive jo-amerikane që bëjnë hapa të rëndësishëm në zhvillimin e AI, duke sfiduar nocionin e dominimit amerikan në këtë fushë.
Chatterji e sheh këtë si pjesë të një demokratizimi më të madh të teknologjisë AI. “Ajo që unë shoh këtë zhbllokim – duke përdorur Llama 3, duke përdorur Qwen – ekipet në të gjithë botën, nëpër shtresa të ndryshme ekonomike, mund të fillojnë të ndërtojnë produkte vërtet të pabesueshme,” tha ai.
Ai shtoi se ka të ngjarë të shohim që këto modele të optimizohen për pajisjet e edge dhe celularë, duke çuar në “aplikacione të jashtëzakonshme celulare dhe aplikacione në ueb dhe aplikacione në edge që ndërtohen me këto modele me burim të hapur”.
Indeksi prezanton një fokus të ri në mënyrën se si modelet trajtojnë gjatësi të ndryshme të kontekstit, nga fragmentet e shkurtra deri te dokumentet e gjata, duke reflektuar përdorimin në rritje të AI për detyra si përmbledhja e raporteve të gjata ose përgjigjja e pyetjeve rreth grupeve të gjera të të dhënave. Kjo qasje ofron një pamje më të nuancuar të aftësive të modelit, thelbësore për bizneset që konsiderojnë vendosjen e AI në skenarë të ndryshëm.
“Ne u fokusuam në zbërthimin e tij bazuar në gjatësinë e kontekstit – i vogël, i mesëm dhe i madh,” tha Chatterji për VentureBeat. “Kjo dhe pjesa tjetër e madhe këtu ishte kostoja kundrejt performancës. Sepse kjo është shumë e rëndësishme për njerëzit.”
Indeksi zbuloi gjithashtu se më e madhe nuk është gjithmonë më mirë kur bëhet fjalë për modelet e AI. Në disa raste, modelet më të vogla ia kalonin homologëve të tyre më të mëdhenj, duke sugjeruar se dizajni efikas ndonjëherë mund të tejkalojë shkallën e madhe.
“Modeli Gemini 1.5 Flash ishte një zbulim absolut për ne, sepse i kaloi modelet më të mëdha,” tha Chatterji. “Kjo sugjeron që nëse keni efikasitet të madh të dizajnit të modelit, kjo mund të tejkalojë shkallën.”
Ky zbulim mund të nxisë një ndryshim në zhvillimin e AI, me kompanitë që fokusohen më shumë në optimizimin e arkitekturave ekzistuese sesa thjesht në rritjen e madhësisë së modelit.
Gjetjet e Galileos mund të ndikojnë ndjeshëm në adoptimin e AI të ndërmarrjes. Ndërsa modelet me burim të hapur përmirësohen dhe bëhen më me kosto efektive, kompanitë mund të përdorin aftësi të fuqishme të AI pa u mbështetur në shërbime të shtrenjta pronësore. Kjo mund të çojë në një integrim më të gjerë të AI në të gjithë industritë, duke rritur potencialisht produktivitetin dhe inovacionin.
Startup-i, i cili ofron mjete për monitorimin dhe përmirësimin e sistemeve të AI, po pozicionohet si një lojtar kyç për të ndihmuar ndërmarrjet të lundrojnë në peizazhin që evoluon me shpejtësi të modeleve gjuhësore. Duke ofruar standarde të rregullta praktike, Galileo synon të bëhet një burim thelbësor për vendimmarrësit teknikë.
“Ne duam që kjo të jetë diçka që klientët tanë të ndërmarrjeve dhe përdoruesit e ekipit tonë të AI thjesht mund ta përdorin si një burim të fuqishëm, gjithnjë në zhvillim për mënyrën më efikase për të ndërtuar aplikacione të AI në vend që thjesht, ju e dini, të ndjeheni në errësirë dhe duke u përpjekur ta kuptoj atë, “tha Chatterji.
Ndërsa gara e armatimeve të AI intensifikohet, me modele të reja që dalin pothuajse çdo javë, indeksi i Galileo ofron një pamje të një industrie në fluks. Kompania planifikon të përditësojë standardin çdo tremujor, duke ofruar një pasqyrë të vazhdueshme në ndryshimin e ekuilibrit midis teknologjive të AI me burim të hapur dhe atyre të pronarit.
Duke parë përpara, Chatterji parashikon zhvillime të mëtejshme në këtë fushë. “Ne kemi filluar të shohim modele të mëdha që janë si sisteme operative për këtë arsyetim shumë të fuqishëm,” tha ai. “Dhe do të bëhet gjithnjë e më e përgjithësueshme gjatë rrjedhës së ndoshta një deri në dy vitet e ardhshme, si dhe të shohim se gjatësitë e kontekstit që ata mund të mbështesin, veçanërisht në anën e burimit të hapur, do të fillojnë të rriten shumë më tepër. Kostoja do të ulet shumë, thjesht do të hyjnë ligjet e fizikës.”
Ai gjithashtu parashikon një rritje të modeleve multimodale dhe sistemeve të bazuara në agjentë, të cilat do të kërkojnë korniza të reja vlerësimi dhe ka të ngjarë të nxisin një raund tjetër inovacioni në industrinë e AI.
Ndërsa bizneset përballen me ritmin e shpejtë të avancimit të AI, mjete si Indeksi i Halucinimit të Galileos ka të ngjarë të luajnë një rol gjithnjë e më të rëndësishëm në informimin e vendimmarrjes dhe strategjisë. Demokratizimi i aftësive të AI, i shoqëruar me rëndësinë në rritje të efikasitetit të kostos, sugjeron një të ardhme ku AI i avancuar nuk është vetëm më i fuqishëm, por edhe më i aksesueshëm për një gamë më të gjerë organizatash.
Ky peizazh në zhvillim paraqet mundësi dhe sfida për bizneset. Ndërsa disponueshmëria e modeleve të inteligjencës artificiale me performancë të lartë dhe me kosto efektive mund të nxisë inovacionin dhe efikasitetin, ajo gjithashtu kërkon shqyrtim të kujdesshëm se cilat teknologji duhet të adoptohen dhe si t’i integrohen ato në mënyrë efektive.
Ndërsa linja midis AI me burim të hapur dhe të pronarit vazhdon të mjegullohet, kompanitë do të duhet të qëndrojnë të informuara dhe të shkathëta, të gatshme për të përshtatur strategjitë e tyre ndërsa teknologjia evoluon. Standardi i Galileos shërben jo vetëm si një pamje e gjendjes aktuale të AI, por si një udhërrëfyes për lundrimin në botën komplekse dhe që ndryshon me shpejtësi të inteligjencës artificiale.