Modelet e inteligjencës artificiale shpesh japin përgjigjet e sakta, por tregojnë burime të gabuara

Vetëm pse një model gjuhësor i përgjigjet një pyetjeje në lidhje me një PDF nuk do të thotë se e ka gjetur përgjigjen aty ku pretendon.

Studiuesit në Universitetin e Pekinit dhe Laboratorin e Inteligjencës Artificiale të Shangait ndërtuan një pikë referimi të re të quajtur CiteVQA për të zbuluar këtë boshllëk midis marrjes së përgjigjes së saktë dhe drejtimit të burimit të duhur. Ata e quajnë atë “halucinacion atribuimi”.

Testet standarde të analizës së dokumenteve si DocVQA ose MMLongBench-Doc vlerësojnë vetëm përgjigjen përfundimtare. Ato nuk mund të tregojnë nëse një model ka nxjerrë në të vërtetë informacion nga dokumenti apo thjesht ka hamendësuar bazuar në atë që tashmë e dinte. Megjithatë, në ligj, auditimet financiare ose mjekësi, gjurmueshmëria është ajo që e bën një rezultat të inteligjencës artificiale të përdorshëm në radhë të parë, argumenton dokumenti.

CiteVQA i bën modelet të mbështesin çdo deklaratë me një shënues të saktë në dokument. Ato duhet të tregojnë paragrafin, tabelën ose figurën e saktë. Vetëm një numër faqeje nuk mjafton. Seti i të dhënave mbulon 1,897 pyetje në 711 PDF nga shtatë fusha lëndore: 451 në anglisht dhe 260 në kinezisht. Dokumentet mesatarisht kanë 40.6 faqe secili, shumë më gjatë se shumica e standardeve.

Tags: AI, Artificial Intelligence, Beijing, CiteVQA, DocVQA, kuriozitete, lajme, lajme shqip, lajmet e dites, lajmet e fundit, MMLongBench-Doc, PDF

Modelet e inteligjencës artificiale shpesh japin përgjigjet e sakta, por tregojnë burime të gabuara

Drejtuesi kryesor i sigurisë së OpenAI largohet nga kompania, ndërsa gjiganti i AI përgatitet për një IPO madhështore

OpenAI mbyll shfletuesin Atlas vetëm tetë muaj pas lançimit dhe integron të gjitha funksionet e tij në ChatGPT

OpenAI publikon GPT-5.6 dhe mjetin ChatGPT Work

Drejtuesi kryesor i sigurisë së OpenAI largohet nga kompania, ndërsa gjiganti i AI përgatitet për një IPO madhështore

Gjigantët e teknologjisë marrin 350 miliardë dollarë borxh për të financuar garën për qendrat e të dhënave të inteligjencës artificiale

Google u shiti modele të inteligjencës artificiale kompanive kineze të sanksionuara

Anëtarët e rinj të grupit të punës të Fed ndajnë mbështetjen e kryetarit Kevin Warsh për inteligjencën artificiale

Phia akuzohet për ‘cookie stuffing’, duke përvetësuar komisione nga blerje që nuk i kishte siguruar vetë

Meta tërheq funksionin e AI në Instagram vetëm pak ditë pas lançimit

You may have missed

Drejtuesi kryesor i sigurisë së OpenAI largohet nga kompania, ndërsa gjiganti i AI përgatitet për një IPO madhështore

Gjigantët e teknologjisë marrin 350 miliardë dollarë borxh për të financuar garën për qendrat e të dhënave të inteligjencës artificiale

Google u shiti modele të inteligjencës artificiale kompanive kineze të sanksionuara

Anëtarët e rinj të grupit të punës të Fed ndajnë mbështetjen e kryetarit Kevin Warsh për inteligjencën artificiale

Phia akuzohet për ‘cookie stuffing’, duke përvetësuar komisione nga blerje që nuk i kishte siguruar vetë

More Stories

You may have missed