Aeneas AI i Google DeepMind u jep historianëve një mjet të ri për të deshifruar mbishkrimet e lashta latine

foto

Google DeepMind, në bashkëpunim me studiues nga disa universitete, ka zbuluar Aeneas, një model të ri të inteligjencës artificiale të projektuar për të ndihmuar historianët të deshifrojnë mbishkrimet e lashta latine. I njoftuar më 23 korrik 2025, në një punim, mjeti analizon si tekstin ashtu edhe imazhet për të restauruar gravura të dëmtuara, për të parashikuar origjinën e tyre dhe për të gjetur paralele kontekstuale.

foto

Aenea synon të përshpejtojë punën e mundimshme të epigrafisë duke u ofruar studiuesve hipoteza të bazuara në të dhëna dhe krahasime relevante. Duke u integruar në rrjedhën historike të punës, mjeti i disponueshëm falas premton të thellojë kuptimin tonë të botës romake duke lidhur pjesë të fragmentuara të së kaluarës në mënyrë më efikase se kurrë më parë.

foto

Sfida kryesore në epigrafi është konteksti. Për shekuj me radhë, historianët janë përballur me detyrën e mundimshme të interpretimit të mbishkrimeve që shpesh janë fragmentare, të dëmtuara ose të hequra nga vendndodhja e tyre origjinale. Kjo punë tradicionalisht kërkon një dituri të jashtëzakonshme dhe kërkime manuale të mundimshme nëpër arkiva të gjera për të gjetur paralele – tekste të ngjashme që mund të japin të dhëna për kuptimin, datën ose origjinën e një mbishkrimi.

Aeneas është projektuar për të automatizuar këtë proces kompleks dhe që kërkon shumë kohë. Ai arsyeton nëpër mijëra mbishkrime latine, duke gjetur paralele tekstuale dhe kontekstuale brenda sekondave. Qëllimi është të zvogëlohet mbështetja në hipoteza spekulative dhe të bazohet interpretimi i një historiani në një rrjet më të gjerë provash, duke i lejuar ata të ndërtojnë mbi gjetjet e modelit.

Projekti thekson fuqimisht bashkëpunimin njeri-IA. Ekipi është i përqendruar në “krijimin e një mjeti që do të integrohet me rrjedhën e punës së një historiani”, sipas studiuesit të Google DeepMind, Yannis Assael. Objektivi nuk është të zëvendësojë ekspertët njerëzorë, por të rrisë aftësitë e tyre, duke i liruar ata që të përqendrohen në analiza të nivelit më të lartë në vend të mbledhjes manuale të të dhënave.

Për të vërtetuar këtë qasje bashkëpunuese, ekipi kreu një studim në shkallë të gjerë me 23 epigrafë , duke filluar nga studentët e masterit deri te profesorët. Rezultatet ishin domethënëse: sugjerimet e Eneas shërbyen si një pikënisje e vlefshme për hetim 75% të kohës, dhe historianët raportuan një rritje mesatare prej 23% të besimit kur përdorën paralelet e saj.

Rritjet në efikasitet ishin veçanërisht të habitshme. Një pjesëmarrës vuri në dukje, “paralelet e gjetura nga Enea e ndryshuan plotësisht fokusin tim historik. […] do të më duheshin disa ditë në vend të 15 minutave [për të gjetur këto tekste]”. Një tjetër vlerësoi ndikimin e tij cilësor, duke deklaruar, “paralelet e Eneas e ndryshuan plotësisht perceptimin tim për mbishkrimin. Ai vuri re detaje që bënë gjithë ndryshimin për restaurimin dhe atribuimin kronologjik të tekstit”.

Aeneas prezanton disa inovacione teknike që e dallojnë atë nga modelet gjuhësore me qëllim të përgjithshëm. Ndërsa LLM-të masive kërkojnë miliarda dokumente, natyra e specializuar e epigrafisë dhe disponueshmëria e kufizuar e skanimeve me cilësi të lartë kërkojnë një zgjidhje më të përshtatur.

Fuqia e modelit vjen nga një arkitekturë e sofistikuar e bazuar në transformatorë. Në thelbin e tij është një dekoder T5 që përpunon sekuencat e karaktereve, të shtuara me rrjete nervore të specializuara, ose “koka”, secila e përshtatur për një detyrë specifike epigrafike si restaurimi, datimi ose atribuimi, siç detajohet në dokumentin themelor të projektit.

Një përparim kyç është aftësia e tij për të rikthyer boshllëqet në tekst ku gjatësia e segmentit që mungon është e panjohur – një problem i zakonshëm dhe i vështirë për historianët. Enea përdor një simbol të veçantë për të treguar këtë pasiguri dhe punëson një rrjet ndihmës për të parashikuar nëse nevojiten një ose më shumë karaktere, duke e bërë atë një mjet shumë më të gjithanshëm për skenarë të botës reale.

Për më tepër, Enea është modeli i parë i këtij lloji që përdor të dhëna multimodale – si tekst ashtu edhe imazhe – për të përcaktuar origjinën gjeografike të një mbishkrimi. Një rrjet vizioni analizon objektin fizik, duke i lejuar modelit të marrë në konsideratë formën dhe paraqitjen e tij së bashku me përmbajtjen e tij, një aspekt thelbësor i studimit epigrafik.

I gjithë ky sistem është trajnuar mbi Setin e të Dhënave Epigrafike Latine (LED) të përpiluar rishtazi. Ky korpus masiv, që përmban mbi 176,000 mbishkrime, u harmonizua nga bazat e të dhënave kryesore akademike. Modeli përdor këto të dhëna për të krijuar “integrime” historikisht të pasura për secilin tekst, duke kapur modele delikate që identifikojnë lidhje të thella përtej kërkimeve të thjeshta me fjalë kyçe.

Performanca e modelit është testuar me rigorozitet. Ai mund t’i atribuojë një mbishkrim njërës prej 62 provincave romake me saktësi 72% dhe t’i datojë tekstet brenda një mesatareje prej 13 vitesh nga diapazoni i ofruar nga historianët.

Në një studim rasti bindës, Enea analizoi të famshmen Res Gestae Divi Augusti, rrëfimin e Perandorit August për arritjet e tij. Modeli prodhoi një shpërndarje bimodale të datave që pasqyronte në mënyrë sasiore debatin shkencor mbi përbërjen e tij, duke identifikuar të njëjtat shënjues gjuhësorë dhe historikë që përdorin ekspertët.

Studimi bashkëpunues konfirmoi më tej vlerën e tij praktike. Historianët që përdorën Enean panë përmirësimin e performancës së tyre solo dhe 90% e pjesëmarrësve raportuan se sugjerimet e mjetit nxitën ide të reja kërkimore. Një historian vlerësoi ndikimin e tij, duke deklaruar: “Paralelizimet e Eneas ndryshuan plotësisht perceptimin tim për mbishkrimin. Ai vuri re detaje që bënë gjithë ndryshimin për restaurimin dhe atribuimin kronologjik të tekstit”.

Megjithatë, disa ekspertë mbeten optimistë të kujdesshëm. Kathleen Coleman, një profesoreshë në Harvard, vuri në dukje se, ndërsa premtuese, “nuk është ende e qartë se sa e dobishme do të jetë për rrjedhën e punës së historianëve në planin afatgjatë”, duke theksuar nevojën për vlerësim afatgjatë në këtë fushë.

Aeneas është shtesa më e fundit në iniciativën “IA për Shkencën” të Google DeepMind, një përpjekje strategjike për të aplikuar IA-në në sfidat themelore të kërkimit. Ky portofol përfshin mjete si AlphaFold për parashikimin e strukturës së proteinave dhe AlphaGenome për kërkimin gjenetik.

Kjo punë ndjek një model të qartë të zhvillimit të IA-së specifike për domenin, e cila mund të analizojë hapësira të gjera dhe komplekse informacioni për të përshpejtuar zbulimin, siç shihet edhe me modele si AlphaGeometry2 për matematikën dhe të tjera për parashikimin e uraganeve .

Ky projekt pasqyron gjithashtu një angazhim ndaj shkencës së hapur. Modeli Aeneas, kodi i tij dhe të dhënat themelore janë të gjitha të disponueshme publikisht përmes një faqeje interneti të dedikuar dhe një depoje GitHub. Si pjesë e lançimit, modeli i mëparshëm i Ithaca për greqishten e lashtë është përmirësuar me arkitekturën më të fuqishme të Aeneas.

Për studiuesit, ëndrra është të kenë një mjet të tillë në vend. Siç e tha epigrafja Thea Sommerschield nga Universiteti i Nottinghamit, “të kesh Enean në krah ndërsa je në muze ose në vendin arkeologjik ku sapo është gjetur një mbishkrim i ri – ky është skenari ynë i ëndrrave”.