Apple bashkohet me NVIDIA për të shpejtuar modelet e gjuhës së AI

Apple ka ndarë detaje mbi një bashkëpunim me NVIDIA për të përmirësuar në masë të madhe performancën e modeleve të gjuhëve të mëdha (LLM) duke zbatuar një teknikë të re të gjenerimit të tekstit që ofron përmirësime të konsiderueshme të shpejtësisë për aplikacionet e AI.

Apple në fillim të këtij viti publikoi dhe me burim të hapur Recurrent Drafter (ReDrafter), një qasje që kombinon kërkimin me rreze dhe metodat dinamike të vëmendjes së pemës për të përshpejtuar gjenerimin e tekstit. Kërkimi me rreze eksploron sekuenca të shumta të mundshme teksti në të njëjtën kohë për rezultate më të mira, ndërsa vëmendja e pemës organizon dhe heq mbivendosjet e tepërta midis këtyre sekuencave për të përmirësuar efikasitetin.

Apple tani e ka integruar teknologjinë në kornizën TensorRT-LLM të NVIDIA, e cila optimizon LLM-të që funksionojnë në GPU-të NVIDIA, ku arriti “performancën më të mirë”, sipas Apple. Integrimi pa që teknika të menaxhonte një rritje të shpejtësisë 2.7x në shenjat e gjeneruara në sekondë gjatë testimit me një model prodhimi që përmban dhjetëra miliarda parametra.

Apple thotë se performanca e përmirësuar jo vetëm që redukton vonesën e perceptuar nga përdoruesi, por gjithashtu çon në ulje të përdorimit të GPU-së dhe konsumit të energjisë. Nga blogu i Kërkimit të Mësimit të Makinerisë së Apple:
“LLM-të po përdoren gjithnjë e më shumë për të fuqizuar aplikacionet e prodhimit dhe përmirësimi i efikasitetit të konkluzioneve mund të ndikojë në kostot llogaritëse dhe të zvogëlojë vonesën për përdoruesit. Me qasjen e re të ReDrafter për dekodimin spekulativ të integruar në kornizën NVIDIA TensorRT-LLM, zhvilluesit tani mund të përfitojnë nga gjenerimi më i shpejtë i shenjave në GPU-të NVIDIA për aplikacionet e tyre të prodhimit LLM.”

Zhvilluesit e interesuar në zbatimin e ReDrafter mund të gjejnë informacion të detajuar si në faqen e internetit të Apple ashtu edhe në blogun e zhvilluesve të NVIDIA.

Tags: AI, apple, Artificial Intelligence, Computer, gpu, kuriozitete, lajme, lajme shqip, lajmet e dites, lajmet e fundit, LLM, mobile, Nvidia, Recurrent Drafter, ReDrafter

Apple bashkohet me NVIDIA për të shpejtuar modelet e gjuhës së AI

Nvidia po bashkon emrat më të mëdhenj industrialë të Japonisë rreth platformës së saj robotike me inteligjencë artificiale fizike

TSMC do të investojë edhe 100 miliardë dollarë të tjerë në SHBA

Intel është prodhuesi i parë i çipave që prodhon në masë çipa duke përdorur mjetin e gjeneratës së ardhshme të printimit të ASML

Moonshot pezullon abonimet e reja për Kimi K3 pasi kërkesa për GPU arriti kapacitetin maksimal brenda 48 orësh

AliExpress gjobitet me një rekord prej 629 milionë dollarësh për shitjen e produkteve të falsifikuara dhe të paligjshme

Një agjent i inteligjencës artificiale hakoi Hugging Face

Google planifikon një çip të ri të quajtur ‘Frozen’

Alibaba lançon Qwen 3.8 me 24 trilionë parametra, duke synuar modelet më të avancuara të inteligjencës artificiale

Raketa e parë e zhvilluar privatisht në Indi arrin orbitën në një lëshim debutues spektakolar

You may have missed