GAIAK

Adimen Artifizialaren bidez euskara digitalizatzen aurrera egiteko europar proiektua martxan da

‘Linguatek IA’ aurkeztu dute, mugaz gaindiko Europako proiektua. Pirinioen bi aldeetako baliabide gutxiko hizkuntzei aplikatzeko moduko Adimen Artifizialeko ezagutza garatzea du helburu. Euskara, aragoiera, katala eta okzitaniera digitalizatzen laguntzeko proiektua da.

‘Linguatek IA’ proiektuaren aurkezpena. (Elhuyar)

Adimen Artifizialaren bidez aragoiera, euskara, katalana eta okzitaniera digitalizatzen aurrera egiteko ‘Linguatec IA’ proiektua jarri du martxan Elhuyar buru duen partzuergo batek. Pirinioez eta mugaz gaindiko europar proiektuak oinarriak ezarri ditu Pirinioen bi aldeetako baliabide gutxiko hizkuntzei aplikatzeko moduko Adimen Artifizialeko ezagutza garatzeko.

Elhuyarretik jakinarazi dutenez, hizkuntza prozesamendua «tresna indartsua» da baliabide urriko hizkuntzak dituzten erkidegoentzat, hizkuntza biziberritzen eta haren erabilera eraginkortasunez sustatzen laguntzen baitu. «Hizkuntza horientzat berebiziko garrantzia du Adimen Artifizialaren olatura igotzeak, atzean ez geratzeko», gaineratu dute.

Edonola ere, hizkuntza naturalaren prozesamenduan lortutako kalitatea ez dago hizkuntza guztien eskura, eta lankidetza «funtsezkoa» da hizkuntza baliabide eta tresna berriak garatzeko. Gainera, berrikuntzako ahalegina areagotu beharra dagoela iritzi du Elhuyarrek, eta apustu egin du hizkuntza naturalaren prozesamendurako adimen artifizialaren arloko ikerketa aplikatuaren alde.

‘Linguatec IA’ Europako proiektuak bi helburu ditu: batetik, baliabide gutxi dituzten hizkuntzei aplikatzeko moduko hizkuntza eredu sortzaile berriei buruzko Adimen Artifizialeko ezagutza garatzea eta, bestetik, eredu horiek erabiltzea aragoiera, katalana, euskara eta okzitaniera digitalizatzen aurrera egiteko eta mugaz gaindiko azpiegitura linguistiko adimendun bat eraikitzeko, hizkuntza ezberdinetako hiztunen arteko komunikazioa eta informazioa ele anitzetan eskuratzea erraztuko baitu.

Lan oinarriak

Partzuergoak bere lan oinarriak ezarri zituen Usurbilen urtarrilaren 15ean egindako lehen bileran. Partzuergoa «Pirinioetako sei hizkuntzen inguruan komunitate zientifiko bat osatzen duten goi mailako zenbait erakundek osatzen dute, zeinak hizkuntza horiek berreskuratu eta biziberritzeko helburua duten», adierazi du ‘Linguatec’ proiektuaren koordinatzaile Josu Aztiriak. Gaineratu duenez, proiektuak «mugaz gaindiko lurraldeko gizartea eta kultura egituratzen laguntzen du, tokiko kulturaren funtsezko elementu bat indartuz: hizkuntzak».

Ildo horretan, proiektuan parte hartzen duten erakundeek jada lanean dihardute hizkuntzaren prozesamenduarekin lotutako zenbait eremutan, hala nola konputazioko eta hizkuntza baliabide mugatuko egoeretara egokitutako arkitektura neuronalak eta algoritmo berriak garatzen.

Halaber, Aztiriak adierazi duenez, «euskararen, katalanaren, okzitanieraren eta aragoieraren eta haien dialektoen transkripzioko, itzulpen automatiko neuronaleko eta ahots sintesiko sistemak hobetu nahi ditugu, frantsesarekin eta espainierarekin konbina daitezen, bai eta automatikoki azpititulatzeko eta bikoizteko hizkuntza plataforma eleaniztun bat garatu ere». «Aurreikusi dugu online plataforma edo gordailu bat sortzea Pirinioetako hizkuntzetarako garatzen ditugun baliabide, teknologia eta aplikazio guztiekin», gaineratu du.

Proiektu hau osatzen duten erakundeek uste dute beren lana oso lagungarria izango dela «bai hizkuntzen eta haiek digitalizatzearen arloan lan egiten duen ikertzaile eta profesional komunitatearentzat, bai erakunde publiko eta pribatuentzat, beren zerbitzuak hobetu eta zenbait hizkuntzatan eskuragarri jarri ahal izango baitituzte». Halaber, harro agertu dira «herritarrei ingurune eleaniztun batean errazago komunikatzen laguntzeko baliabide eta tresna baliagarriak eskaintzeaz».

Partaideak

Orai adimen artifizialeko zentroaren bidez Elhuyarrek gidatzen duen proiektu honen partzuergoko kideak dira Lo Congres Permanent de la LengaOccitana, EHUko HiTZ zentroa, Okzitaniako Tolosako Jean Jaures Unibertsitatea, Perpinyako Unibertsitatea, Baionako IKER-CNRS, Aragoiko Gobernua eta Lleidako Unibertsitatea.