Anthropic po ndihmon NSA-n
Anthropic ka vendosur rreth gjashtë inxhinierë brenda Agjencisë së Sigurisë Kombëtare për të ndihmuar në vendosjen e Mythos – modelit të saj më të aftë të inteligjencës artificiale – për operacione sulmuese kibernetike, raportoi të enjten Financial Times.
Inxhinierët janë staf i vendosur përpara, duke e përshtatur modelin për aplikime specifike. Një burim i tha FT se mund të jetë i dobishëm për infiltrimin e rrjeteve në vende si Kina dhe Irani.
Nuk është konfirmuar nëse këta inxhinierë janë të përfshirë në operacione aktive. Çfarë është: Mythos është i njëjti model që Anthropic ka refuzuar ta publikojë publikisht, duke përmendur rrezikun e keqpërdorimit. Kompania e kufizoi atë në partnerë të verifikuar përmes Project Glasswing – një koalicion i kufizuar që përfshin Microsoft, Apple dhe Amazon.
Anthropic po padit gjithashtu Pentagonin. Në fund të shkurtit, Sekretari i Mbrojtjes Pete Hegseth e përcaktoi kompaninë si një rrezik për zinxhirin e furnizimit – një etiketë historikisht e rezervuar për kundërshtarët e huaj si Huawei – pasi një kontratë prej 200 milionë dollarësh dështoi. Pika kritike: Anthropic refuzoi të lejonte Departamentin e Mbrojtjes të përdorte Claude për armë plotësisht autonome ose mbikëqyrje masive vendase. Kontrata e NSA-së ishte e përjashtuar nga ky ndalim.
Një gjykatës i Kalifornisë bllokoi futjen në listën e zezë si një hakmarrje të dukshme sipas Amendamentit të Parë. Një gjykatë apeli e DC-së hodhi poshtë kërkesën e Anthropic për ta ndaluar atë ndërsa procesi gjyqësor vazhdon. NSA vazhdoi të përdorte Mythos gjatë gjithë kohës, sipas raportimit të FT.
Në të njëjtën ditë që u publikua historia e NSA-së, instituti i brendshëm i kërkimit i Anthropic publikoi “Kur IA Ndërton Veten”, një vështrim mbi atë se sa larg ka arritur Claude në automatizimin e zhvillimit të vet. Në të, kompania argumenton për një moratorium global në garën e armatimeve të IA-së – dhe madje e krahasoi atë me traktatet bërthamore të epokës së Luftës së Ftohtë të arritura midis Shteteve të Bashkuara dhe Rusisë.
Për të kuptuar pse, kompania dha këtë kontekst të shkurtër:
Claude tani shkruan më shumë se 80% të kodit të bashkuar në bazën e kodit të prodhimit të Anthropic – një rritje nga shifrat e ulëta njëshifrore përpara se Claude Code të lançohej në fillim të vitit 2025. Inxhinierët dërgojnë afërsisht tetë herë më shumë kod në ditë sesa në vitin 2024.

Autorët e raportit – drejtuesja e Institutit Anthropic, Marina Favaro, dhe bashkëthemeluesi Jack Clark – argumentojnë se kjo trajektore po shkon drejt asaj që ata e quajnë vetë-përmirësim rekursiv: sisteme të inteligjencës artificiale që projektojnë, ndërtojnë dhe trajnojnë në mënyrë autonome pasardhësit e tyre, me njerëzit që luajnë një rol në rënie në çdo hap.
Në një përfaqësim vizual, studiuesit tregojnë një vijë kohore në të cilën mënyra e parë për të përdorur IA-në në punë është se njerëzit e nxisin kompjuterin të marrë një rezultat, me automatizime në rritje që përfundojnë me agjentë të IA-së që nxisin nën-agjentë derisa të arrihet rezultati, pa përfshirjen e njerëzve.

Pika më e mprehtë e të dhënave që ata citojnë: Në prill, agjentëve të Claude iu dha një problem i hapur sigurie i IA-së – nëse një model më i dobët mund të mbikëqyrë me besueshmëri një më të fortë – dhe u lanë ta ekzekutonin atë. Dy studiues njerëzorë, gjatë rreth një jave, rikuperuan 23% të hendekut të performancës midis modeleve. Agjentët rikuperuan 97%, mbi 800 orë kumulative llogaritëse. Njerëzit e vendosën pyetjen. Agjentët hartuan çdo eksperiment. Është rasti i parë i publikuar i Claude që ushtron gjykim kërkimor, jo vetëm ekzekutimin e detyrave të specifikuara nga dikush tjetër.
Kjo është vija që Anthropic shqetësohet se mund ta kalojë. Pasi inteligjenca artificiale të zgjedhë se cilat eksperimente ia vlejnë të kryhen – jo vetëm t’i kryejë ato – njerëzit humbasin rolin e fundit domethënës në ciklin e zhvillimit. Mospërputhjet e vogla të dukshme në modelet e sotme mund të shtohen në brezat që po përmirësohen vetë derisa askush të mos mund t’i korrigjojë ato.
Zgjidhja e tyre e propozuar është një pauzë globale e verifikueshme – laboratorë të shumtë kufitarë që ndalojnë njëkohësisht, me verifikim të pavarur që të gjithë ndaluan në të vërtetë. Anthropic tha se do t’i bashkohej njërit prej tyre. Një ngadalësim i njëanshëm, pranojnë ata, thjesht ia jep epërsinë kujtdo që vazhdonte.
E kemi parë këtë film më parë. Laboratorët që ndërtojnë inteligjencën artificiale janë të njëjtët që paralajmërojnë se sa e rrezikshme është inteligjenca artificiale. Megjithatë, inteligjenca artificiale është biznesi më fitimprurës i dekadës, kështu që askush nuk dëshiron të ndalet – madje as ata që paralajmërojnë për të.
Në vitin 2023, mbi njëqind emra të mëdhenj në komunitetin e kërkimit të inteligjencës artificiale nënshkruan një letër të hapur duke kërkuar një përpjekje globale për të zbutur rrezikun e zhdukjes që zhvillimi i inteligjencës artificiale e ka në thelb. Disa muaj më parë, një letër tjetër e hapur kërkoi që OpenAI të pezullonte përparimet në ChatGPT për shkak të natyrës së tij të rrezikshme.
Askush nuk u ndal pas letrës së hapur të vitit 2023. OpenAI jo. Anthropic jo. Afati i fundit i Pentagonit për të hequr Claude nga sistemet e tij bie në gusht, afërsisht në të njëjtën kohë kur pritet që oferta fillestare publike e Anthropic të nxjerrë financat e saj në publik.
