Meta lëshon modele të reja të AI për zërin dhe emocionet

foto

Meta ka zbuluar disa modele të reja të inteligjencës artificiale (AI), duke përfshirë një të krijuar për të vlerësuar modele të tjera të AI, si pjesë e përpjekjeve të saj të vazhdueshme për të avancuar inteligjencën e avancuar të makinerisë (AMI). Këto modele kanë për qëllim rritjen e aftësive të AI në fusha të shumta, duke vazhduar fokusin e Meta në nxitjen e inovacionit dhe bashkëpunimit brenda komunitetit të kërkimit të AI.

foto

Modelet e publikuara rishtazi përfshijnë modelin e vlerësuesit të vetë-mësuar, modelin e segmentit të çdo gjëje (SAM) 2.1, Meta Spirit LM, Layer Skip, SALSA dhe Meta Lingua, ndër të tjera. Secili prej këtyre modeleve fokusohet në aspekte të ndryshme të AI, si perceptimi, fjalimi, gjuha, arsyetimi dhe shtrirja.

foto

Vlerësuesi vetë-mësues është një model i krijuar për të trajnuar sistemet e shpërblimit duke përdorur të dhëna sintetike, duke eliminuar nevojën për shënime njerëzore. Duke përdorur një mekanizëm të ashtuquajtur ‘LLM-as-a-Judge’, Vlerësuesi Vetëmësues është krijuar për të përmirësuar në mënyrë të përsëritur performancën e modeleve të tjera, duke çuar në përfitime të konsiderueshme të efikasitetit në platforma si RewardBench. Meta pohon se modeli përfaqëson një hap përpara në modelimin e shpërblimeve, duke mundësuar procese trajnimi më të shkallëzuara dhe të shpejta.

SAM 2.1 i përditësuar përfshin teknikat e shtimit të të dhënave dhe trajtimin e përmirësuar të okluzionit. SAM 2.1 përdoret gjerësisht në fusha të tilla si imazhet mjekësore dhe meteorologjia për aftësinë e tij për të segmentuar objekte më të vogla dhe më të ngjashme vizualisht.

Meta ka lëshuar gjithashtu SAM 2 Developer Suite, i cili përfshin kod me burim të hapur për studiuesit dhe zhvilluesit e interesuar në personalizimin dhe rregullimin e modelit. Ndërkohë, Meta Spirit LM është një model gjuhësor multimodal që integron tekstin dhe të folurin duke përdorur një teknikë ndërthurjeje në nivel fjalësh. Ky model vjen në dy versione të ndryshme: Spirit LM Base, i cili përdor shenja fonetike dhe Spirit LM Expressive, i cili përdor shenja të lartësisë dhe stilit për të kapur tonin, duke përfshirë emocione si eksitimi ose zemërimi.

Këto modele mbështesin detyra që përfshijnë njohjen automatike të të folurit, konvertimin tekst në të folur dhe klasifikimin e të folurit, duke ofruar rezultate më të natyrshme dhe të pasura në kontekst.

Layer Skip është një model i fokusuar në optimizimin e performancës së modeleve të mëdha gjuhësore (LLM) duke ekzekutuar shtresa selektive dhe duke verifikuar rezultatet përmes shtresave pasuese. Kjo qasje redukton kostot llogaritëse, duke përmirësuar efikasitetin dhe performancën e energjisë.

Për më tepër, Meta ka lëshuar pika kontrolli të rregulluara mirë për modele të tilla si Llama 3, të cilat demonstrojnë efikasitet dhe saktësi të përmirësuar me daljet e hershme. Teknika Layer Skip pritet të kontribuojë në kërkimin e vazhdueshëm në optimizimin e AI duke ofruar një rrugë me efikasitet energjie për vendosjen e modeleve të mëdha.

Nga ana e tij, modeli SALSA fokusohet në krahasimin e sulmeve të bazuara në AI kundër kriptografisë së bazuar në rrjetë, duke synuar në mënyrë specifike sekretet e rralla në këto standarde kriptografike. Kriptografia e bazuar në rrjetë, e rekomanduar nga Instituti Kombëtar i Standardeve dhe Teknologjisë (NIST), është një element themelor i kriptografisë post-kuantike (PQC). Aftësitë e SALSA janë krijuar për të ndihmuar në vërtetimin dhe përmirësimin e sigurisë së këtyre sistemeve, duke siguruar elasticitet ndaj kërcënimeve të mundshme të drejtuara nga AI.

Meta Lingua, është një bazë kodi e lehtë, modulare për trajnimin e modeleve gjuhësore në shkallë. Ai synon të zvogëlojë kompleksitetin teknik të përfshirë në trajnimin e modeleve, duke i lejuar studiuesit të përqendrohen në dizajnin eksperimental dhe jo në pengesat infrastrukturore. Duke thjeshtuar procesin e trajnimit të modelit, Meta Lingua mbështet eksperimentimin e shpejtë dhe lehtëson përkthimin praktik të ideve konceptuale të AI në rezultate të prekshme.

Ekspertët e AI kanë argumentuar se modelet e reja të Metës janë të kufizuara në disa aspekte kryesore. Kritikët pretendojnë, për shembull, se SAM 2.1 ende lufton me segmentimin kompleks në detyrat mjekësore dhe meteorologjike, ndërsa efikasiteti i Layer Skip mund të rrezikojë në mënyrë ironike saktësinë e tij, duke kufizuar përdorimin në financa dhe ligj. Mbështetja e vlerësuesit të vetë-mësuar në të dhënat sintetike, ndërkohë, ngre shqetësime për paragjykimet në kujdesin shëndetësor dhe shkallëzueshmëria e SALSA mbetet e diskutueshme përtej standardeve specifike kriptografike.

Të tjerë në komunitetin me burim të hapur e kanë kritikuar Metën për etiketimin e modeleve të tyre ‘burim të hapur’ kur, në realitet, shumica e aspekteve të funksionimit të tyre mbeten private. Sipas shefit të Iniciativës me Burim të Hapur, Stefano Maffulli, gjigandi i mediave sociale po “ndotte” termin, duke i thënë Financial Times se përdorimi i termit nga firma ishte “i dëmshëm” në një kohë kur juridiksione si BE-ja po kërkonin të përkrahnin inovacionin në sektori.