«Digitalean euskararik ez bada, beste hizkuntzetan erabiltzen ohituko gara»
1971n Arrasaten jaioa, Errenterian bizi da. Doktorea da Informatikan eta ingeniari elektronikoa. Elhuyarreko hizkuntza eta hizketa teknologien sailaren arduraduna da, baita berriki aurkeztutako Aditu proiektuarena ere. Audio eta bideoak automatikoki transkribatzeko eta azpititulatzeko lehen euskal plataforma da Aditu. Euskarari lekua egiten dio gero eta digitalagoa, «onlineagoa», den bizitza honetan.
Aditu zerbitzu edo plataforma bat da, hizketazko audioen transkripzioa egiten duena. Azpitituluak ere sortzen ditu eta nahi izanez gero erraten dioguna zuzenean transkribatzen du. Proiektuaren arduradunak zabaltzen dituen aukerak nabarmendu ditu eta magikoa dirudien gailu honen sortze prozesua nolakoa izan den azaldu du.
Zer berri dakar Adituk?
Online, jendeak erabiltzeko moduan, irekia dagoen halako lehenengo zerbitzua da euskaraz. Beste batzuen aldean (Google kasu) gureak konfidentzialtasuna bermatzen du eta neurri-neurriko soluzioak eskaintzen ditu. Plataforma edozein pertsona, enpresa, erakundek baliatu dezake bere audio edo bideoak transkribatzeko. Eta bestelako behar bereziak dituen enpresa batek transkripzio zerbitzua bere laneko fluxuan edo erabiltzen duen plataforma edo programan integratzea behar badu, aukera hori ematen dugu.
Zerbitzua dohainik proba daiteke Aditu.eus webgunean bost minutuz. Hortik aitzinera tarifa ezberdinak eskaintzen dituzue, beharren arabera egokituak.
Transkripzio zerbitzuak askotan emaitza oso onak ematen ditu; kalitate oneko audio bat bada, zaratarik ez badago, ondo ahoskatuta eta euskara batuan hitz eginez gero. Beste kasu batzuetan, ez dabil hain ondo. Doako erregistro bidez proba dezake norberak duen behar konkreturako balio dion ala ez, eta gero, nahi izanez gero, webgunearen bidez kontratazio puntualak egin daitezke: ordu bat transkribatzeko, edo hamar, prezio ezberdinekin, orduen arabera. Bolumen handiagoetarako edo bestelako zerbitzu berezietarako gurekin hitz eginda neurrira egindako zerbitzu eta tarifak eskain ditzakegu.
Sortze prozesua luzea eta zaila imajinatzen dugu. Kontaguzu nola egin duzuen.
Bi fase nagusi ezberdinduko nituzke. Lehenengo fasea da transkripzio teknologia bera garatzea. Hori da lanik zailena, adimen artifiziala eta sare neuronalak baliatuta sistema bat sortzea euskaraz transkribatzeko gai izango dena. Kasu honetan euskaraz eta gaztelaniaz ere bai. Hasieran horretan ibili ginen buru-belarri ikusi genuen arte emaitza onak lortzen genituela. Iruditzen zitzaigun inportantea zela hori euskal gizartearen esku jartzea, jendeak baliatzeko.
Lehenengo ikerketa edo garapen fase hori, transkripzio teknologiarena, amaitu ostean, erabaki genuen zerbitzu edo plataforma martxan jartzea, eta horrek ekarri du beste fase bat, nahi baino luze eta konplikatuagoa, jendeak erraz baliatzeko interfaze eroso eta atsegin batean, editatzeko aukerarekin.
Guztira zenbat denbora eman duzue lanean?
Ez nuke jakingo esaten noiz hasi ginen hizketa-ezagutzako sistema hau garatzen, orain bizpahiru urte, edo lau, baina azpimarratu behar da honen atzean Elhuyarreko hizkuntza eta hizketa teknologien ikerketa eta garapeneko taldea dagoela. Lantalde horren barruan garatu da teknologia eta, ondotik, zerbitzu hau. Urteak daramatza Elhuyarrek itzulpen automatikoa, zuzentzaile ortografikoak, bilatzaile eleaniztunak… lantzen, hizkuntza teknologiak ikertzen eta horietan oinarritutako zerbitzuak eskaintzen. Eta horrek denak ahalbidetu du Aditu.
Batak bertzea elikatu duela erran dezakegu orduan?
Bai. Jakintza, hizkuntza eta hizketa teknologiak hainbat arlo ditu; ezberdinak dira neurri batean, baina elementuak konpartitzen dituzte.
Zenbat lagunek osatzen duzue Elhuyarreko hizkuntza teknologien saila eta zein profiletako profesionalak zarete?
Hamar bat pertsonako taldea izango gara. Hizkuntza eta hizketa teknologiek hizkuntza eta teknologia nahasten dituzte. Orduan badago osagai bat linguistikoagoa; hizkuntzalariak behar dira, adibidez, itzulpen automatikoko sistema bat entrenatzeko testuak zuzentzeko. Talde misto bat da, badaude hizkuntzalariak, baina batez ere informatikariak gara.
Jon Abril Elhuyarreko zuzendariak aurkezpenean aipatu du hizketa-ezagutza itzulpen automatikoarekin edo beste zerbitzu batzuekin konbinatzen bada aukerak izugarri zabalduko direla.
Bai. Orain aurkeztu duguna hizketa-ezagutzailea da. Testu hori itzulpen automatikoz pasatu dezakegu beste hizkuntza batera. Gainera, badaukagu lehenagotik testu bat audio bihurtzen duen sistema bat. Pentsa dena konbinatuta zer lor dezakegun: norbaitek hizkuntza batean esandakoa testura pasatu dezakegu, gero testu hori itzuli eta azkenik audio bihurtu hizkuntza berrian. Beste gauza asko ere ahalbidetzen ditu, adibidez etxeetan dauden bozgorailu adimendunak, ‘Alexa, jarridazu musika’ eta horrelako aginduak jasotzen dituztenak, euskaraz erabiltzea.
Halako sistema bat toki askotan integra daiteke.
Ikus-entzunezko sektoreari azpititulatzeko balio diezaioke. Filmak zailagoak dira, baina dokumentalak, albistegiak, erreportajeak… azpititulatzeko egokia da, baita bideo korporatibo, hitzaldi eta ikastaroak ere. Kazetarientzat lagungarria da norbaiti elkarrizketa egitean eskuz transkribatu beharrean automatikoki testuak egiteko. Pertsona-makina elkarrekintzarako ere aproposa da, etxeko tresnak ahotsez kontrolatzeko. Eta irisgarritasunerako: azpitituluak eskaintzeko pertsona gorrei edo entzuteko arazoak dituztenei eta, adibidez, eskuak mugitu ezin dituen norbaitek ordenagailuz idatzizko lan bat egiteko, baina hizketaz eta euskaraz. Beste sektore bat izan daiteke administrazio publikoarena, udalbatzarrak transkribatzeko eta aktak idazteko eta nahi bada esaten dena zuzenean azpititulatzen joateko.
Lanik astun eta aspergarriena kentzen duzue.
Sistema hau atera aurretik hainbat jenderekin probatan aritu gara eta tokatzen zaionak beti esaten du transkripzio lana dela okerrena, orduak behar direla, eta grabazioa kalitate onarekin badago eta transkribatzaileak akats gutxi egiten baditu lan denbora hamar bider gutxitu daiteke.
Magia dirudi.
Neurri batean hala da. Lehen barre egiten zen itzulpen automatikoko sistemez, denok esaten genuen ‘zer gaizki egiten duten!’, eta oso denbora gutxian harritzera pasatu gara, ‘nolatan egin du hau hain ondo?’.
Sistemak beren kabuz doaz ikasten adimen artifizialaren bitartez?
Ez berez. Entrenatu egin behar ditugu adibideak emanda eta bai, zerotik abiatzen dira eta ikasi egiten dute. Behin ikasi dutenean kaleratzen ditugu. Gero, ikasketa hori hobetzen joan gaitezke eta bertsio berriak atera ditzakegu.
Aditu hobetzeko asmoa duzue.
Bai. Aurkezpenean ikusi dugun bezala, kasu askotan oso-oso ondo dabil, baina beste batzuetan okertzen hasten da eta horiek dira hobetu nahi ditugunak. Adibidez, audio kalitate txarragoarekin edo euskalkiekin ondo moldatzeko.
Abrilek aipatu du asmo handiko plan bat behar dela Adituren gisako teknologiak garatzen jarraitu ahal izateko eta administrazioari dei egin dio. Behar hori ikusten duzu?
Bai. Gure bizitza gero eta digitalagoa da, ‘onlineagoa’, ikus-entzunezkoagoa, gero eta presenteago daude telefonoak… Eta horietan, konturatzen ez bagara ere, hizkuntza oso garrantzitsua da. Hau da, ikus-entzunezkoen munduan ia dena euskara ez den beste hizkuntza batzuetan dago, bozgorailu adimendunak ez du euskaraz funtzionatzen, Netflixek ez dauka apenas edukirik euskaraz… Horregatik oso garrantzitsua da hizkuntza eta hizketa teknologia hauek garatzea eta benetan apustu bat egitea hauek ondo funtzionatzeko eta, zergatik ez, etorkizunean ahalbidetzeko Netflixeko eskaintza guztia egotea gutxienez euskaraz azpititulatuta.
Beti esaten da ikus-entzunezkoak sortzeak eta azpititulatzeak kostua daukala, orduan kostu hori pixka bat murrizten ahal dugu teknologia erabilita, baina horretarako teknologia horiek egon behar dira, eta gero eta hobeto. Horregatik, plana eta inbertsioa oso garrantzitsuak dira.
Euskara ezin delako kanpoan gelditu.
Hori da. Nik uste neurri batean mundu horretan gero eta kanporago gelditzen ari dela euskara; Euskal Telebista atera zenean euskarazko kanal bat zegoen gaztelaniazko pare baten aldean, baina gaur egun lau kanal dira euskaraz milaren artean. Youtuben zer esanik ez. Horretan guztian lehiatzeko dena eskuz itzultzen eta sortzen ezin da ibili. Gailuekin dugun elkarrekintzan ere, bozgorailu adimendunarekin edo elkarrizketa agenteekin, horietan ere euskara ez badago, jendea beste hizkuntzetan kontsumitzera eta elkarrekintza egitera ohituko da. Euskarak besteen mailan egon behar du, trena galdu gabe.