Apple po punon për të integruar modelin e madh Google Gemini në iPhone për të fuqizuar Siri e re

foto

Është e pamundur të shmangësh plotësisht inteligjencën artificiale gjeneruese kur bashkëvepron me teknologjinë, por Apple e ka pak më pak. Megjithatë, kjo nuk është tërësisht zgjedhje. Prodhuesi i iPhone e ka vonuar disa herë Siri-n e përmirësuar me inteligjencë artificiale që nga premtimi i parë në vitin 2024, por një marrëveshje me Google do ta bashkojë asistentin ikonik me Gemini më vonë këtë vit. Ndërsa i afrohemi Konferencës Botërore të Zhvilluesve, Apple ka punuar për të sjellë inteligjencë të madhe artificiale në mjedisin modest të përpunimit të një telefoni inteligjent. Megjithatë, tifozëve të Apple mund të mos u pëlqejë rezultati.

foto

Apple ka kohë që flet me entuziazëm për vlerën e privatësisë që sjell përdorimi i inteligjencës artificiale në nivel lokal , por një raport i ri sugjeron se pavarësisht përpjekjeve më të mira të Apple, ndryshimi i iPhone në Gemini do të mbështetet shumë te Google dhe Nvidia në cloud. The Information raporton se Siri i Apple, i integruar me Gemini, do të funksionojë si në pajisje ashtu edhe në cloud, një përmbysje e dukshme e preferencës së saj për inteligjencën artificiale lokale, e cila është e fokusuar te privatësia.

foto

Me çdo njoftim të ri për çip, dëgjojmë se si silikoni është optimizuar për IA-në – madje edhe Apple e bën këtë me fokusin e saj në përmirësimet e Motorit Neural. Mund të mendoni nga gjuha madhështore se telefonat inteligjentë janë të pajisur për të trajtuar modele të fuqishme të IA-së, por kjo nuk është domosdoshmërisht rasti . Në fakt, GPU-të në shumicën e telefonave mund të përpunojnë më shumë tokena IA sesa NPU-të e fokusuara në IA. Komponentë si Motori Neural i Apple janë të dizajnuar për përpunim kontekstual dhe efikas të IA-së. Edhe nëse telefonat do të kishin përpunim më të shpejtë të IA-së, atyre u mungon RAM-i për të mbajtur modele të mëdha në memorie.

Edhe modelet më të mëdha të IA-së janë ende asistentë mesatarë, dhe kjo e bën IA-në lokale shumë sfiduese. Modelet e IA-së që funksionojnë në telefona janë fizikisht më të vogla, duke shfaqur maksimumi disa miliardë parametra. Krahasojeni këtë me modelet më të fundit Gemini të Google, të cilat kanë triliona parametra, raporton The Information. Modelet e IA-së në pajisje janë gjithashtu “kuantizuar” për të funksionuar me saktësi më të ulët, duke i bërë ato më të shpejta, por duke ndikuar në saktësinë e gjenerimit të tokenëve. E gjithë kjo çon në IA që ndihen më pak të zgjuara se vëllezërit e tyre në cloud, dhe madje edhe modelet e mëdha të bazuara në cloud mund të jenë mjaft të pakuptimta ndonjëherë.

Google ka versione të Gemini të optimizuara për pajisjet mobile, të cilat i quan Gemini Nano . Megjithatë, këto janë të dizajnuara për të mundësuar funksione kontekstuale si Magic Cue dhe përmbledhja audio. Siri, nga ana tjetër, supozohet të jetë një asistent bisedor – ju flisni me të dhe ai bën gjëra. Kjo është një përvojë e ndryshme që kërkon një lloj modeli të ndryshëm. Në Android, Google as nuk shqetësohet ta bëjë këtë në nivel lokal. Biseda me Gemini gjithmonë shkon direkt në cloud.

Pasi nënshkroi marrëveshjen me Google, Apple me sa duket filloi punën për distilimin e modeleve gjigante Gemini të bazuara në cloud të Google. Distilimi është një proces në të cilin një model i vogël, që kërkon më pak burime, mëson të imitojë një model të madh dhe të shtrenjtë. Me kohë të mjaftueshme, kjo mund të transferojë në mënyrë të besueshme aftësi të dobishme, duke krasitur pesha më pak të rëndësishme nga modeli. Kjo mund t’i mundësojë Siri-t të trajtojë disa detyra me llogaritje lokale private, por një komponent cloud duket i pashmangshëm.

Përpunimi i të dhënave të inteligjencës artificiale të përdoruesve në cloud mund të jetë një problem për Apple. Në WWDC, kompania ndoshta do të promovojë vitet e saj të përvojës në dizajnimin e çipave dhe sa mirë e pozicionon kjo atë për IA-në. Megjithatë, The Information pretendon se Apple ka pasur vështirësi të vërë në punë edhe modelet masive të padistiluara Gemini të Google në infrastrukturën e saj të personalizuar Private Cloud Compute, e cila është ndërtuar mbi çipat Mac të serisë M.

Kur të dalë në treg Siri më i zgjuar, ai ndoshta do t’i drejtojë detyrat më komplekse në infrastrukturën cloud të Google në vend të asaj të Apple, por nuk do të funksionojë në TPU-të e Google. Apple thuhet se ka nënshkruar një marrëveshje me Nvidia për të përdorur platformën e saj Confidential Computing për këtë qëllim. Confidential Computing i mban të dhënat e enkriptuara në GPU-të Nvidia ndërsa ato përpunohen në cloud, gjë që mund ta ndihmojë Apple të pretendojë se është ende e ndjeshme ndaj shqetësimeve për privatësinë e përdoruesve. Madje mund të ruajë edhe markën e vet Private Cloud Compute për sistemin.

iPhone ndoshta nuk do t’ju tregojë se cili version i Gemini po trajton kërkesat individuale të Siri-t. Prodhuesit e pajisjeve që projektojnë sisteme hibride që mbështeten në inteligjencën artificiale lokale dhe të bazuar në cloud pëlqejnë të flasin për ta bërë përvojën të ndihet “e përsosur”. Megjithatë, mund të ketë të dhëna.

Të gjithë jemi të njohur me ngadalësinë e modeleve të mëdha të IA-së, të cilat mund të funksionojnë për një kohë të gjatë ndërsa gjenerojnë tokena. Llogaritja Konfidenciale e Nvidia-së, plotësisht e enkriptuar, bën përpunim të ngadaltë krahasuar me opsionet e tjera të IA-së. Përdoruesit mund ta gjejnë më të dukshëm kur Siri duhet të flasë me një server të largët, por IA lokale do t’ju çojë vetëm deri në një pikë të caktuar kur modelet më të mira mund të funksionojnë vetëm në servera me vlerë shumë milionë dollarë.