GAIAK

NAIZ, itzultzaile neuronalen inguruko bi proiektutan murgilduta

Itzultzaile automatikoen garapenaren inguruko bi proiektutan murgilduta dago NAIZ, adimen mailan jauzi kualitatibo bat eta akatsak identifikatzen lagunduko duen euskarrietan lanean.


Itzulpen prozesuak optimizatzeko eta errore mota ezberdinak identifikatzeko, euskarri teknologikoa behar da, azken emaitzaren kalitatea balioesteko. Horretara dator IKA proiektua, datozen hiru urteetan luzatuko dena. Itzulpen automatiko neuronalen kalitatea aztertu eta horien akatsak neurtzeko tresna bat garatzea du jomuga.

Etengabe sortutako datu bolumenak eta itzulpen automatikoak alderatzeko giza itzulpen-erreferentzien urritasuna kontuan hartuta, beharrezkoa da elementu teknologiko bat garatzea, giza erreferentzietarako sarbiderik ez duen itzulpen bakoitzaren kalitatearen estimazio fidagarri eta sendoaren euskarri izan dadin, hau da, sarrera testuen eta horien itzulpenen ezaugarriak soilik kontuan hartuta.

Itzulpen automatikoen kalitatea esaldi, hitz eta dokumentu osoen mailan modu sendoan balioesteko aukera ematen duen tresna integratu baten bidez, IKA proiektuak beharrezko euskarri teknologikoa eman nahi du.

‘Hazitek’ programaren baitako bi ikerkuntza proiektu hauek Lakuako Gobernuaren diru-laguntza jaso dute eta Eskualde Garapenerako Europar Funtsaren bidez kofinantziatuak izan dira. NAIZek egitasmo honetan parte hartzen du bere argitaratzailea den Tai Gabe Digitala enpresaren bitartez, beste zenbait enpresarekin batera: Mondragon Lingua, Bakun eta Berba. Vicomtech ikerkuntza zentroak zuzentzen ditu proiektuak, beste enpresen partaidetzarekin.

Azken urteotan itzulpen automatiko neuronaleko sistemak itzulpen automatikoaren paradigma berri bihurtu dira, bai maila zientifikoan bai komertzialean. Google, Microsoft, Systran eta sektoreko eragile nagusiek sare neuronaletan oinarritutako itzultzaileak plazaratu zituzten bere garaian, eta pixkanaka gero eta hizkuntza gehiagotara egokitzen ari dira euren eskaintza. Euskara eta pareko hizkuntza gutxituen kasuan, ordea, emaitzak ez dira hain onak izan orain arte. Zentzu honetan, aipagarria da Modela ikerketa proiektuan lortutako emaitzek eragindako jauzi kualitatiboa, Vicomtech eta Elhuyar-en eskutik garatua.

Aurrerapausoak aurrerapauso, erronka handiak aurkezten ditu proiektuak. «Gaur egungo itzulpen automatikoko sistemen kalitatea nabarmen aldatzen da domeinu pareen edo domeinu espezifikoen artean, eskuragarri dauden erreferentziazko giza itzulpenen bolumenen arabera, sistemak entrenatzeko funtsezko oinarria baitira. Hizkuntza pare batean edo berariazko domeinu batean, datu-bolumen handirik ez badago, nabarmen jaitsi daiteke itzulpen automatikoaren kalitatea», hausnartzen dute proiektuaren bultzatzaileek.

Beren funtzionatzeko moduagatik, sistema hauek arintasun handiko itzulpenak sortzen dituzte, baina informazioa jatorrizko hizkuntzan gorde beharrik gabe. Horrela, itzulpenak sor ditzake helmugako hizkuntzan dauden hitz sekuentziekin, sarrerako testuarekin inolako loturarik izan gabe (itzulpen-haluzinazioa izeneko fenomenoa da hau), edo jatorrizko informazioarekin lotura txikia duten hitzak dituztenak ere.

Gaur gaurkoz, teknologia honek ez du bermatzen terminologia gordetzea, esparru horretan oraindik ere ikergaia baita aurrez ezarritako korrespondentziak dituzten itzulpenak behartu ahal izatea, hala nola korrespondentzia terminologikoak. Muga hori galga garrantzitsua da kalitate handiko itzulpen ziurtatuak sortzeko. Kasu gehienetan, esaldi mailako itzulpenak sortzen ditu, dokumentu baten testuinguru orokorra kontuan hartu gabe.

Enpresetan honek sortzen dituen produktibitate galerak eta prozesuen optimizazioak hobetzeko asmoarekin, beraz, egingo du lan IKA proiektuak.

ITAI proiektua, ikaskuntza iraunkorrerako

Bestetik, ITAI proiektuaren helburua itzultzaile automatiko neuronalen ikaskuntza iraunkorrerako sistema bat garatzea da.

Garatuko den sistemak sortutako hizkuntza baliabide berriak modu etengabe eta automatizatuan integratzeko aukera emango du. Ondorioz, egun eskura ditugun itzultzaile automatikoen adimen mailan jauzi kualitatiboa ekarri eta etengabe ikasi eta hobetzeko gaitasuna eskainiko du.

NAIZekin batera, MondragonLingua, Emun, IAmetza, Mixer eta, euskal zientzia eta teknologia sareko kide modura, Vicomtech dira ITAI proiektuko kide.