Libra

Inteligjenca Artificiale po na ndihmon të lexojmë literaturën e lashtë të Mesopotamisë

Gjatë gjithë shekullit të njëzetë, ishte i njohur vetëm versioni fragmentar i prologut të Eposit të Gilgameshit. Gjenerata të tëra lexuesish, kur u përballën për herë të parë me klasikun më të shquar të letërsisë së lashtë të Mesopotamisë, përjetuan zhgënjimin e leximit të një teksti fragmentar, duke u mjaftuar vetëm me një vështrim përciptazi në botën e babilonasve.

Teksti origjinal u shkrua në kuneiform, sistemi i shkrimit më i përhapur dhe historikisht i rëndësishëm në Lindjen e Mesme të lashtë. Emri i tij vjen nga përshtypjet në formë pyke (në latinisht, cuneus) që formojnë shenjat e tij.

Lidhur me pamundësinë e leximit të gjithë poezisë, një kuneiformist u shpreh i zhgënjyer: “Rreshtat e hapjes së Eposit të Gilgameshit, për fat të keq, ende nuk mund të lexohen plotësisht pa përdorur mjaftueshëm imagjinatën”.

Ky zhgënjim është, edhe sot, buka dhe gjalpi i çdo kuneiformisti, i përjetuar shpesh “kur dikush lufton me një tekst fragmentar në dhomën e studentëve të Muzeut Britanik dhe dyshon me pak a shumë arsye se pjesë të paidentifikuara janë të shtrira në sirtarë vetëm pak metra larg”. Hyni në Platformën Elektronike të Bibliotekës Babilonase (eBL).

Arritja në letërsinë babilonase

Objektivi kryesor i projektit eBL është të avancojë të kuptuarit e letërsisë babilonase duke e rindërtuar atë në masën më të plotë të mundshme. Për më tepër, projekti synon të sigurojë një platformë miqësore për përdoruesit që përmban transliterime të gjera të fragmenteve të tabletave kuneiforme, së bashku me një mjet të fuqishëm kërkimi, për të adresuar problemin e qëndrueshëm të natyrës së fragmentuar të letërsisë mesopotamiane.

Thelbi i projektit është Fragmentarium, i cili bashkon në mënyrë dixhitale transliterimet e fragmenteve të pllakave kuneiforme. Këto pllaka kuneiforme janë gërmuar kryesisht në shekullin e 19-të dhe që atëherë janë ruajtur në sirtarët e muzeve të ndryshme.

Në veçanti, Muzeu Britanik mban qindra mijëra pllaka kuneiforme, shumë prej të cilave nuk janë lexuar që nga antikiteti. Bashkëpunimi me Muzeun Britanik ka dixhitalizuar dhjetëra mijëra nga këto tableta dhe i ka transliteruar ato në Fragmentarium.

Nëse Fragmentarium është shtylla kurrizore e projektit, vitrinë e tij është eBL Corpus. Korpusi është konceptuar të përmbajë botime të të gjithë “klasikëve” të letërsisë babilonase të kopjuara gjatë mijëvjeçarit të parë p.e.s.

Botimet eBL përdorin shumë fragmente të pabotuara ose të paredaktuara më parë, shpesh të identifikuara nga anëtarët e projektit, dhe kështu përfaqësojnë versione të fundit të teksteve.

Lidhja e bazave të të dhënave

Problemi kryesor me të cilin përballemi është që këto dy baza të dhënash të mëdha tekstuale (Fragmentarium dhe Corpus) të bisedojnë me njëra-tjetrën. Literatura nga Mesopotamia e lashtë është ende e mbushur me boshllëqe tekstuale dhe identifikimi i fragmenteve për të mbushur këto boshllëqe ka qenë tradicionalisht i ngadalshëm dhe i mundimshëm për shkak të paqartësive të shkrimit kuneiform.

Në të vërtetë, shkrimi kuneiform nuk njeh drejtshkrim. Nuk ka asnjë mënyrë të vetme dhe standarde për të shkruar një fjalë. Shkrimtarët, kur kopjonin tekste tradicionale, do t’i përshtatnin ato me dialektet e tyre specifike ose preferencat drejtshkrimore. Për rrjedhojë, detyra e identifikimit të fragmenteve bëhet sfiduese, pasi shenjat e pranishme në një fragment mund të ndryshojnë nga ato që gjenden në një tjetër.

Siç ndodh në shumë sisteme shkrimi të lashta dhe moderne, i njëjti karakter kuneiform mund të përfaqësojë lexime të shumta fonetike dhe fjalë të tëra. Kur ka kontekst të mjaftueshëm, atëherë kuptimi i shumëfishtë nuk është problem: zakonisht ka vetëm një lexim të saktë për secilën shenjë.

Në një projekt të fundit, ne trajnuam një model AI me një korpus relativisht të vogël (më pak se 20,000 rreshta) dhe pa përdorur një listë shenjash, për ta bërë të qartë këtë kuptim të shumëfishtë… Kompjuteri arriti një shkallë suksesi prej 98%.

Megjithatë, me fragmente të veçuara, nuk ka lexim të saktë të një karakteri. Leximi bëhet i mundur vetëm nëse identifikohet se nga vjen fragmenti.

Gjithashtu, nuk kemi një tabelë të vetme të plotë kuneiforme nga e cila të rindërtojmë fillimin e një vepre si Gilgameshi. Në vend të kësaj, ne posedojmë një mori dorëshkrimesh, disa prej të cilave mbivendosen. Në mënyrë tipike, vetëm disa fragmente të çdo dorëshkrimi mbijetojnë.

Çelësi për identifikimin e pjesëve shtesë, dhe rrjedhimisht për avancimin e rindërtimit, qëndron në zbulimin e mbivendosjeve midis fragmenteve, të cilat, nga ana tjetër, do të mundësojnë zbulimin e mbivendosjeve të mëtejshme me fragmente të tjera, etj.

Fjalët si ADN-ja jonë historike

Është interesante se zëvendësimet e hasura në tekstet kuneiforme kanë ngjashmëri me variacionet gjenetike që gjenden në ADN. Marrja në konsideratë e variacioneve të tilla është një shqetësim qendror në bioinformatikë, e cila ka çuar në zhvillimin e algoritmeve të shumta të rreshtimit të sekuencave.

Projekti eBL ka zbatuar algoritëm të ngjashëm të shtrirjes së vargjeve të përshtatur posaçërisht për shkrimin kuneiform, duke lehtësuar procesin e identifikimit dhe duke përshpejtuar ndjeshëm progresin.

Duke përdorur këtë algoritëm dhe mjetet e tjera të ndryshme që projekti eBL ka vënë në dispozicion të studiuesve, ekipi i përkushtuar ndaj tij në Universitetin Ludwig Maximilian të Mynihut ka arritur të identifikojë mijëra fragmente të reja dhe ka avancuar ndjeshëm rindërtimin e literaturës babilonase.

Nëse 150 vitet e ekzistencës së Asiriologjisë para projektit gjetën 5000 pjesë kuneiforme që mund të bashkoheshin me pjesë tashmë të njohura, pesë vitet e projektit eBL i kanë shtuar 1500 të tjera në numër dhe disa mijëra që nuk mund të bashkohen drejtpërdrejt.

Ritmi është vetëm duke u përshpejtuar dhe shpresohet që pas publikimit të portalit elektronik të Bibliotekës Babilonike, studiues të tjerë dhe amatorë do t’i përdorin këto mjete për të rindërtuar tekste të lashta pjesërisht të humbura. /The Conversation/


Copyright © Gazeta “Si”


Më Shumë