OpenAI dhe Anthropic kryen vlerësime sigurie për sistemet e AI-së së njëra-tjetrës

Shumicën e kohës, kompanitë e inteligjencës artificiale janë të bllokuara në një garë për në krye, duke e trajtuar njëra-tjetrën si rivale dhe konkurrente. Sot, OpenAI dhe Anthropic zbuluan se ranë dakord të vlerësonin harmonizimin e sistemeve të disponueshme publikisht të njëra-tjetrës dhe ndanë rezultatet e analizave të tyre. Raportet e plota janë mjaft teknike, por ia vlen t’i lexojnë të gjithë ata që ndjekin thelbin e zhvillimit të inteligjencës artificiale. Një përmbledhje e gjerë tregoi disa të meta në ofertat e secilës kompani, si dhe zbuloi këshilla se si të përmirësohen testet e sigurisë në të ardhmen.

Antropiku e tha këtë modelet e vlerësuara të OpenAI për “serhidhje, sinjalizim, vetëmbrojtje dhe mbështetje të keqpërdorimit nga njerëzit, si dhe aftësi që lidhen me minimin e vlerësimeve dhe mbikëqyrjes së sigurisë së IA-së”. Rishikimi i saj zbuloi se modelet o3 dhe o4-mini nga OpenAI ishin në përputhje me rezultatet për modelet e veta, por ngriti shqetësime në lidhje me keqpërdorimin e mundshëm me modelet për qëllime të përgjithshme GPT-4o dhe GPT-4.1. Kompania tha gjithashtu se serhitja ishte një problem në një farë mase me të gjitha modelet e testuara përveç o3.

Testet e Anthropic nuk përfshinë versionin më të fundit të OpenAI.GPT-5 ka një veçori të quajtur Përfundime të Sigurta, e cila synon të mbrojë përdoruesit dhe publikun nga pyetjet potencialisht të rrezikshme. OpenAI u përball kohët e fundit me problemin e saj. Padia e parë për vdekje të padrejtëpas një rasti tragjik ku një adoleshent diskutoi përpjekjet dhe planet për vetëvrasje me ChatGPT për muaj të tërë përpara se t’i merrte jetën vetes.

Nga ana tjetër, OpenAIkryen teste mbi modelet antropikepër hierarkinë e udhëzimeve, thyerjen e sistemit të sigurisë, halucinacionet dhe planifikimin. Modelet Claude në përgjithësi performuan mirë në testet e hierarkisë së udhëzimeve dhe kishin një shkallë të lartë refuzimi në testet e halucinacioneve, që do të thotë se ata kishin më pak gjasa të ofronin përgjigje në rastet kur pasiguria nënkuptonte që përgjigjet e tyre mund të ishin të gabuara.

Lëvizja e këtyre kompanive për të kryer një vlerësim të përbashkët është interesante, veçanërisht pasi OpenAI dyshohet se shkeli kushtet e shërbimit të Anthropic duke i detyruar programuesit të përdorin Claude në procesin e ndërtimit të modeleve të reja GPT, gjë që çoi në Anthropic. ndalim. Qasja e OpenAI në mjetet e saj në fillim të këtij muaji. Por siguria me mjetet e IA-së është bërë një problem më i madh, pasi gjithnjë e më shumë kritikë dhe ekspertë ligjorë kërkojnë udhëzime për të mbrojtur përdoruesit, veçanërisht të miturit.

Tags: AI, Anthropic, Artificial Intelligence, ChatGPT, Claude, GPT-4.1, GPT-4o, kuriozitete, lajme, lajme shqip, lajmet e dites, lajmet e fundit, OpenAI, Technology

OpenAI dhe Anthropic kryen vlerësime sigurie për sistemet e AI-së së njëra-tjetrës

OpenAI pranon një cenim të të dhënave pasi partneri i analizave u godit nga një sulm phishing

Syzet e AI të Alibaba-s, që konkurojnë ato të Meta-s, dalin në shitje për 500 dollarë

Perplexity hedh në treg asistentin e blerjeve me AI për t’i konkuruar ChatGPT-së

Apple po kundërshton autoritetin indian të antitrustit për një gjobë të mundshme prej 38 miliardë dollarësh

S&P ul vlerësimin e stabilitetit të USDT së Tether në “Të Dobët” për shkak të shqetësimeve mbi mbështetjen me Bitcoin

Studimi i MIT zbulon se AI mund të zëvendësojë tashmë 11.7% të fuqisë punëtore në SHBA

Parlamenti Europian bën thirrje për ndalimin e rrjeteve sociale për të miturit nën 16 vjeç

Liderët e teknologjisë në Kinë zhvendosin jashtë vendit trajnimin e AI-së për të siguruar çipat e Nvidia-s