Nvidia njofton çipat AI “Rubin Ultra” dhe “Feynman” për vitet 2027 dhe 2028

Të martën në konferencën GTC 2025 të Nvidia në San Jose, Kaliforni, CEO Jensen Huang zbuloi disa GPU të reja përshpejtuese të AI që kompania planifikon të lëshojë gjatë muajve dhe viteve të ardhshme. Ai gjithashtu zbuloi më shumë specifika rreth çipave të shpallur më parë.
Njoftimi qendror ishte Vera Rubin, i ngacmuar fillimisht në Computex 2024 dhe tani është planifikuar të dalë në gjysmën e dytë të 2026. Ky GPU, i quajtur sipas një astronomi të famshëm, do të ketë 288 gigabajt memorie dhe vjen me një CPU të dizajnuar nga Nvidia të quajtur Vera.
Sipas Nvidia, Vera Rubin do të japë përmirësime të rëndësishme të performancës në krahasim me paraardhësin e saj, Grace Blackwell, veçanërisht për trajnimin dhe konkluzionet e AI.

Vera Rubin përmban dy GPU së bashku në një model që japin 50 petaflops të performancës së konkluzionit FP4 për çip. Kur konfigurohet në një raft të plotë NVL144, sistemi jep 3,6 ekzaflops të llogaritjes së konkluzioneve FP4—3,3 herë më shumë se 1,1 exaflops të Blackwell Ultra në një konfigurim të ngjashëm rafti.
CPU Vera përmban 88 bërthama të personalizuara ARM me 176 fije të lidhura me GPU-të Rubin nëpërmjet një ndërfaqeje NVLink me shpejtësi të lartë 1,8 TB/s.
Huang njoftoi gjithashtu Rubin Ultra, i cili do të pasojë në gjysmën e dytë të 2027. Rubin Ultra do të përdorë konfigurimin e raftit NVL576 dhe do të shfaqë GPU-të individuale me katër kapakë të madhësisë së rrjetës, duke ofruar 100 petaflops të saktësisë FP4 (një format me pikë lundruese 4-bit i përdorur për përfaqësimin dhe përpunimin e çipit të numrave AI).
Në nivelin e raftit, Rubin Ultra do të sigurojë 15 ekzaflops të llogaritjes së konkluzionit FP4 dhe 5 ekzaflops të performancës së trajnimit FP8 – rreth katër herë më i fuqishëm se konfigurimi Rubin NVL144. Çdo GPU Rubin Ultra do të përfshijë 1 TB memorie HBM4e, me raftin e plotë që përmban 365 TB memorie të shpejtë.

Për të ardhmen e afërt, Nvidia do të lançojë Blackwell Ultra B300 në gjysmën e dytë të 2025. Ky çip përmban dy GPU që ofrojnë 15 petaflops të performancës së dendur llogaritëse FP4 për çdo çip. Kur konfigurohet në një raft të plotë NVL72, Blackwell Ultra do të sigurojë 1,1 ekzaflops të llogaritjes së dendur të konkluzionit FP4—1,5 herë më shumë se konfigurimi aktual Blackwell B200. Çdo GPU B300 ka 288 GB memorie HBM3e krahasuar me 192 GB të Blackwell.
Huang përmendi shkurtimisht një arkitekturë GPU të gjeneratës së ardhshme të quajtur “Feynman”, të quajtur sipas fizikanit teorik amerikan Richard Feynman. Ai dha disa detaje shtesë rreth dizajnit ose aftësive të Feynman, vetëm se ai do të përdorte një CPU “Vera” në vend të “Richard” të pritshëm bazuar në modelin e emërtimit dhe se do të mbërrinte diku në vitin 2028.

Gjatë fjalimit kryesor, Huang paraqiti gjithashtu një udhërrëfyes optimist për të ardhmen e AI – me suksesin e saj të ndërlidhur në mënyrë jetike me suksesin e vazhdueshëm të kompanisë së tij – ku ai i quajti qendrat e të dhënave “ fabrikat e AI ” që prodhojnë token (njësitë e të dhënave që modelet e AI aktualisht përpunojnë) në vend të objekteve fizike. Ai ndau vizionin e tij për të ardhmen e “AI fizike” që një ditë do të fuqizojë robotët humanoidë për të kryer punë të ngjashme me njeriun. Nvidia aktualisht ofron platforma softuerike që ndihmojnë modelet e AI që kontrollojnë robotët të trajnohen në botët virtuale.
Ndërkohë, Huang spekuloi se çipat Nvidia së shpejti do të fuqizojnë “10 miliardë agjentë dixhitalë” që kryejnë punë të dobishme për njerëzit, dhe ai përmendi se deri në fund të këtij viti, 100 për qind e inxhinierëve të Nvidia do të ndihmohen nga modelet e AI.