2022 EKA. 04 Hizkuntza-teknologia euskararen mesedetan Olatz Arregi Uriarte Donostiako UPV/EHUko Informatika Fakultateko irakasle eta ikertzailea Hizkuntza-teknologiak testuak eta audioak automatikoki lantzeko dauden programak, tresnak eta aplikazioak barneratzen ditu. Gaur egun gure bizitzan gero eta txertatuago daude, eta epe motzean, tresna horiek, behar bezala egokituta, ezinbestean erabiliko dira hainbat arlotan. Oinarrizko aplikazio eta tresna horietako gutxi batzuk aipatuko ditugu hemen, ondoren, horiek konbinatuta egin daitezkeen aplikazio erabilgarri batzuk azaltzeko. 1. Itzulpen automatikoa: testua edo ahotsa hizkuntza batetik bestera itzultzeko, adibidez Elia, edo Itzuli. 2. Txatbota: elkarrizketa ahalbidetzen duen softwarea da, hau da, ahoz edo idatziz solasaldi bat jarraitzeko gai diren programak, bai webgune komertzialetan erabiltzen direnak, bai orokorrak. 3. Testu-sorkuntza: testu berria sortzeko gai diren programak, adibidez, testu berria sortu hasierako hitzak emanda, testu baten laburpena egin, edo txosten bat prestatu datu batzuk emanda. 4. Sentimenduen analisia: testuetan edo audioetan dagoen sentimendua (positiboa, negatiboa...) erauzteko eta sailkatzeko softwarea. 5. Hizketa-ezagutzailea: audio eta bideoak automatikoki transkribatzeko eta azpititulatzeko tresna, adibidez Elhuyarrek sortutako Aditu plataforma. Goian aipatutako tresnak dagoeneko garatuta daude hizkuntza askotarako (euskara barne) eta, horiek egokituta, hiru esparrutan egin daitezkeen adibide batzuk azalduko ditugu. HTa osasungintzan. Mediku-kontsultetan sortzen diren osasun-txostenak modu automatikoan prozesatzeko gai gara egun dagoen teknologiarekin. Txosten horietan dagoen informazioa ondo erauzten bada, hau da, zein diren sintomak, zein gaixotasuna, zer-nolako tratamendua eman zaion eta zein izan den pazientearen eboluzioa, datu horiekin guztiekin medikuek tratamendu egokiagoak aplika ditzakete besteen esperientzian oinarrituta. Arlo honekin jarraituz, mediku-txostenaren laburpen sinplifikatua automatikoki egitea ere gaur egun egingarria da (3). Horrela, pazienteari informazio ulergarria emango litzaioke, erosoen egiten zaion hizkuntzan (1), zehaztasunik galdu gabe. Gainera, laburpen hauek ahots automatikoaren bidez ere jaso ditzake gaixoak, modu honetara, irakurtzeko zailtasunak dituenak ere ez luke arazorik izango informazio hori eskuratzeko. HTa administrazioan. Akta da, oro har, administrazioan hartzen diren erabakiak jasotzeko erabiltzen den dokumentua. Gaur arte, bileretan edo plenoetan idazkaria arduratzen da akta jasotzeaz, ondoren esandakoa txukun idatzi, eta kasu batzuetan, informazio garrantzitsuena, erabakiak edo akordioak, publiko jartzeaz erakundearen webgunean. Egun dugun teknologiarekin, hori dena euskaraz egin daiteke giza interbentzio oso txikiarekin. Sistemak bileran hitz egiten dena audio (edo bideo) batean biltzen du, eta ondoren horren transkripzioa egingo du, hau da, audio hori testu bihurtuko du (5). Testu hau zuzendu edo findu daiteke, eta bideoaren kasuan, azpitituluak ere jar daitezke, nahi izanez gero, hizkuntza ezberdinetan (1). Ondoren, transkribatutako testua, zuzenean akta izan daitekeena, laburtu daiteke (3) eta informazio garrantzitsuena atera, adibidez bertan hartutako erabakiak. Informazio hori erakundearen webgunera eraman daiteke eta hizkuntza ezberdinetan erakutsi (1). HTa turismoan. Arlo honetan badira zenbait aplikazio beste hizkuntzetarako garatuak, euskarara erraz ekar daitezkeenak. Adibidez, turistek edo herritarrek produktuen edo ekimenen inguruan duten iritzia jasotzeko (4) edo informazio turistikoaren zein ondarearen berri modu eleaniztunean eskaintzeko (1). Turismo bulegoetan egin ohi diren kontsultak aztertuta, txatbot eleaniztuna garatu daiteke Euskal Herriko informazio turistikoa emateko (2). Herri batera goazenean ohituta gaude Interneten herriko informazioa bilatzen, baina informazio hori osatu daiteke elkarrizketa-sistema orokorra diseinatzen bada, non herrian ikustekoez gain, uneko ekitaldien informazio zehatza (ordua, tokia...) edo informazio praktikoa (jatetxeak, garraioa...) galdera-erantzun sistema bidez eman daitekeen. Erabiltzaileak galderak bere ama-hizkuntzan egingo lituzke, eta sistemak, erantzunak ere (ahoz zein idatziz) bere hizkuntzan emango lizkioke (1). “Elkarrizketa” bukatuta, emandako informazioarekin asetze-maila zein den jakin daiteke erabiltzailearen erantzunak aztertuta edo hizketaren tonua zein erabilitako hitzak analizatuta (4). •