Një laborator kinez ka lëshuar një model arsyetimi të AI për të rivalizuar o1 të OpenAI

foto

Një laborator kinez ka zbuluar atë që duket të jetë një nga modelet e para të “arsyetimit” të AI për të rivalizuar o1 të OpenAI.

Të mërkurën, DeepSeek , një kompani kërkimore e AI e financuar nga tregtarët sasiorë, publikoi një vrojtim të DeepSeek-R1, për të cilin firma pretendon se është një model arsyetimi konkurrues me o1.

Ndryshe nga shumica e modeleve, modelet e arsyetimit kontrollojnë në mënyrë efektive veten e tyre duke shpenzuar më shumë kohë duke shqyrtuar një pyetje ose pyetje. Kjo i ndihmon ata të shmangin disa nga grackat që zakonisht pengojnë modelet.

Ngjashëm me o1, DeepSeek-R1 arsyeton përmes detyrave, planifikimit përpara dhe kryerjes së një sërë veprimesh që ndihmojnë modelin të arrijë në një përgjigje. Kjo mund të marrë pak kohë. Ashtu si o1, në varësi të kompleksitetit të pyetjes, DeepSeek-R1 mund të “mendojë” për dhjetëra sekonda përpara se të përgjigjet.

foto

DeepSeek pretendon se DeepSeek-R1 (ose DeepSeek-R1-Lite-Preview, për të qenë të saktë) performon në të njëjtin nivel me modelin o1-preview të OpenAI në dy standarde të njohura të AI, AIME dhe MATH. AIME përdor modele të tjera të AI për të vlerësuar performancën e një modeli, ndërsa MATH është një koleksion problemesh me fjalë. Por modeli nuk është perfekt. Disa komentues në X vunë në dukje se DeepSeek-R1 lufton me tic-tac-toe dhe probleme të tjera logjike (si dhe o1).

DeepSeek gjithashtu mund të jailbroken lehtësisht – domethënë, të nxitet në atë mënyrë që të injorojë masat mbrojtëse. Një përdorues X mori modelin për të dhënë një recetë të detajuar të meta.

Dhe DeepSeek-R1 duket se bllokon pyetjet që konsiderohen shumë të ndjeshme politikisht. Në testimin tonë, modelja refuzoi t’u përgjigjej pyetjeve në lidhje me liderin kinez Xi Jinping, sheshin Tiananmen dhe implikimet gjeopolitike të pushtimit të Kinës në Tajvan.

foto

Sjellja ka të ngjarë të jetë rezultat i presionit nga qeveria kineze mbi projektet e AI në rajon. Modelet në Kinë duhet t’i nënshtrohen krahasimit nga rregullatori kinez i internetit për të siguruar që përgjigjet e tyre “të mishërojnë vlerat thelbësore socialiste”. Thuhet se qeveria ka shkuar aq larg sa të propozojë një listë të zezë burimesh që nuk mund të përdoren për të trajnuar modele – rezultati është se shumë sisteme kineze të AI refuzojnë t’i përgjigjen temave që mund të ngrenë zemërimin e rregullatorëve.

Rritja e vëmendjes ndaj modeleve të arsyetimit vjen pasi zbatueshmëria e “ligjeve të shkallëzimit”, teoritë e mbajtura prej kohësh që hedhja e më shumë të dhënave dhe fuqia llogaritëse në një model do të rriste vazhdimisht aftësitë e tij, po vihen nën shqyrtim. Një varg raportesh shtypi sugjerojnë se modelet nga laboratorët kryesorë të AI, duke përfshirë OpenAI, Google dhe Anthropic, nuk po përmirësohen aq dramatikisht sa dikur.

Kjo ka çuar në një përleshje për qasje të reja të AI, arkitektura dhe teknika zhvillimi. Njëra është llogaritja e kohës së testimit, e cila mbështet modele si o1 dhe DeepSeek-R1. I njohur gjithashtu si llogaritja e konkluzioneve, llogaritja në kohë testimi në thelb u jep modeleve kohë shtesë përpunimi për të përfunduar detyrat.

“Ne po shohim shfaqjen e një ligji të ri të shkallëzimit,” tha CEO i Microsoft Satya Nadella këtë javë gjatë një fjalimi kryesor në konferencën Ignite të Microsoft, duke iu referuar llogaritjes së kohës së testimit.

DeepSeek, i cili thotë se planifikon të hapë DeepSeek-R1 me burim dhe të lëshojë një API, është një operacion kurioz. Ai mbështetet nga High-Flyer Capital Management, një fond mbrojtës sasior kinez që përdor AI për të informuar vendimet e tij tregtare.

Një nga modelet e para të DeepSeek, një model i përgjithshëm për analizimin e teksteve dhe imazheve i quajtur DeepSeek-V2, detyroi konkurrentët si ByteDance, Baidu dhe Alibaba të ulnin çmimet e përdorimit për disa nga modelet e tyre – dhe t’i bënin të tjerët plotësisht falas.

High-Flyer ndërton grupet e veta të serverëve për trajnimin e modeleve, më i fundit prej të cilëve thuhet se ka 10,000 GPU Nvidia A100 dhe kushton 1 miliard jen (~ 138 milion dollarë). E themeluar nga Liang Wenfeng, një i diplomuar në shkencat kompjuterike, High-Flyer synon të arrijë AI “superinteligjente” përmes organit të tij DeepSeek.