GARA Euskal Herriko egunkaria
Interview
ITZIAR CORTES
ELHUYARREN ITZULTZAILEAREN ARDURADUNA

«Hizkuntzen teknologia ikertzeak beste hizkuntzen pare jartzen du euskara»

Hamar urte dihardu hizkuntzen teknologia ikertzen eta Elhuyarrek iragan astean gizarteratu zuen itzultzaile automatiko eleaniztunaren arduraduna da Itziar Cortes. Interneten, Itzultzailea.eus webgunean erabilgarri dago asteazkenetik, baita mugikorretarako aplikazioan ere, eta azken horri dagokionez, «nabarmendu nahiko nuke zein erraza den edonork erabiltzeko», Cortesen hitzetan.


Ibilbide luzea du Elhuyarrek itzulpengintza automatikoan. Itzultzaile berria lehenagokoen ondorio izango da, ezta?

Modela.eus mugarria izan zen, horren bidez, itzultzaile neuronalak euskararen eta gaztelaniaren arteko itzulpenak egiteko lehen sistema jarri genuen martxan. Hortik aurrera, erakunde bakoitzak bere ikerketa egiten jarraitu zuen. Elhuyarren jarraitu dugu euskararen eta gaztelaniaren arteko itzulpen automatikoetan ikertzen, sare neuronaletan ikertzen jarraitzen dugu oraindik, baina urtebetean emaitzek nabarmen egin dute hobera. Hori erabiltzailearen esku jarri nahi izan dugu eta, horrez gain, beste hizkuntzekin ere lanean ari garenez, erakutsi nahi dugu horiekin ere badakigula itzultzaile aurreratuak egiten.

Euskara, gaztelania, frantsesa, galegoa eta katalana itzultzeko gai da Itzultzailea. Maila berdina ematen du hizkuntza guztietan?

Bost hizkuntza hauen artean oso emaitza onak ematen ditu. Egia da gehiago landu dugula euskara-gaztelania hizkuntza bikotea, ikerketa mailan ere horretan ari garelako. Baina, hala ere, oso emaitza ona ematen dute guztiek.

Duela bi aste Lakuak itzultzaile berri bat aurkeztu zuen, EHUko Ixa taldea ere aspalditik dabil itzultzaile neuronalen inguruan ikertzen. Erakunde ugari ari dira, beraz, hizkuntzen teknologian lanean. Kaleratu berri duzuen itzultzailea erakunde horien elkarlanaren ondorioa da edo bakoitzak bere bidea egin du?

Elhuyarrek naturalki egiten du lan Ixa taldearekin. Horrez gain, Modela ikerketa proiektu batetik sortu zen, eta proiektu hori denen artean garatu genuen; Vicomtech, EHU, Isea, Ametzagaiña eta Elhuyar, boston artean. Hortik aurrera, bai, bakoitzak bere teknologia garatu eta bere produktua gizarteratu du. Guk, adibidez, orain dela denbora dezentetik, bezeroei, enpresei eta erakundeei itzulpen automatikoko zerbitzua eskaintzen diegu, eta orain pauso bat aurrera egin dugu, gizartearen esku ere jarriz.

Zer ekarpen egiten diote tresna hauek euskarari?

Hizkuntza teknologiak ikertzen jarraitzeak euskararen posizionamendua hobetzen du. Eta euskara beste hizkuntzen parera jartzera eramaten gaitu. Orain dela denbora bat esaten genuen euskararekin zaila zela horrelakorik egitea, baina nik hamar urte daramatzat itzulpen automatikoan lanean, eta esan beharra daukat orain ikusten ditudan emaitzak ez ditudala aurretik inoiz ikusi, eta duda egiten nuen ikusiko nituenik ere. Orain euskararen eta gaztelaniaren arteko itzulpen automatikoak beste kalitate bat dauka, gauza erreal batez ari gara. Nik uste adimen artifizialean egin diren proiektu eta ikerketek ahalbidetu dutela itzulpen automatikoaren bolada hau eta, euskararekin lotuta, iruditzen zait beste arlo batzuetara ere hedatuko dela, euskararen onerako.

Zein da sare neuronalen bidez funtzionatzen duen itzultzaile hau garatzeko Elhuyarrek egin duen bidea?

Itzulpen automatikoarekin hasi ginenean, erregeletan oinarritutako sistemak sortzen ziren, horien adibide Matxin itzultzaile automatikoa da, Ixa eta Elhuyarren artean sortutakoa. Gaztelaniatik euskarara egiten zituen itzulpenak, eta derrigorrez behar genituen baliabideak hauek ziren: hizkuntzalariak, hizkuntzalari horrek kodetzen zituen hiztegiak eta erregelak. Orduan, derrigorrezkoa zen hizkuntza jakitea eta hizkuntzalari bat izatea. Gutxira, Google-k salto handi bat egin zuen, hizkuntza jakin gabe edozein hizkuntzaren arteko itzultzaileak ateratzen zituelako. Hori izan zen estatistikara salto egin zen unea. Guk ere egin genuen, esaldi berriei estatistiketan oinarrituta emaitza bat emateko ahalmena duen sistema garatu genuen. Baina emaitzak ez ziren hain onak. Hirugarren saltoa sare neuronaletakoa izan zen. Lehengaia berdina da, esaldi pila bat eta horien itzulpenak behar dira. Baina jada ez gara estatistikan oinarritzen, beste ikasketa mota bat da. Algoritmo askoz konplikatuagoak erabiltzen dira ikasketa prozesuan. Datu pila bat hartzen dira eta hortik ikasi edo entrenatuz, itzultzaileak sortzen dira.

 

Beraz, etengabe ikasteko ahalmena dauka?

Guk erabakitzen dugu noiz entrenatu berriro. Baina guk inola ez ditugu gordetzen orain erabiltzaileak egiten ari diren itzulpenak, guk konfidentzialtasuna bermatzen dugu. Itzultzaileak ikasten du guk sortzen ditugun datu edo algoritmo berrietatik.

Itzultzaile teknologikoak etengabe garatzen badira, itzultzaile profesionalekin zer gertatuko da etorkizunean?

Itzultzaile profesionalak behar ditugu. Itzultzaile automatikoek oso ondo itzultzen dute, baina itzultzaile profesionalek askoz hobeto. Badaude akats mota batzuk itzultzaile automatikoak ez dituenak detektatzen, beti dago zer aldatu. Egia da itzultzaile automatikoak inoiz ikusi gabeko emaitzak ematen ari direla, baina kontuan hartu behar da, eta hau agian kostatzen zaigu gizarteari transmititzea, itzultzaile automatikoa gauza batzuetarako dela, eta itzultzaile profesionala beste batzuetarako. Itzultzaile automatikoak oso onak dira baina ez dira perfektuak, eta itzultzaile profesionalak behar ditugu.