Maite ORONOZ
Donostiako Informatika Fakultateko irakasle eta ikerlaria, UPV/EHU

ChatGPT, Irulegiko eskua eta haluzinazioak

ChatGPT Irulegiko eskua zer den deskribatzen.
ChatGPT Irulegiko eskua zer den deskribatzen. (GAUR8)

Maiz, zaila egiten zitzaidan hizkuntzaren prozesamenduan (HP) zer egiten genuen azaltzea. Azken hilabeteotan, ordea, HPren aplikazio bat, ChatGPT, ahotik ahora darabilgu, eta hori horrela, ChatGPTren tripetan zer dagoen azaldu genuen martxoko artikuluan (Olatz Arregi, GAUR 8). ChatGPT 2022an sortu zen eta euskaraz “badaki”, baina duela 2.100 urte sortu zen Irulegiko eskuak ere baditu baskoiek erabiltzen zuten euskararen aztarnak. SORIONEKUak gu, hilabete gutxiko tartean gure hizkuntzarentzako hain garrantzitsuak diren albisteak jaso ditugulako. Eta 2.000 urte baino gehiagoko diferentziarekin sortutako testu-euskarri hauen artean zubi bat ezartzen saiatuko bagina, lortuko genuke?

Irulegiko eskuak, oraingoz dakigunaren arabera, ez daki ezer ChatGPTri buruz. Eta ChatGPTk ba al daki zerbait Irulegiko eskuaren inguruan?

Has gaitezen ChatGPT zer den labur azaltzen (xehetasun gehiago martxoko alean). ChatGPT elkarrizketa-sistema bat da, oinarrian hizkuntza-eredu bat duena, zeina eskuz aberastu den elkarrizketak bideratzeko gaitasuna izan dezan. Ekonomian aditua den jende askok aspaldi esana du Hezkuntzan inbertitzen den euro bakoitzeko etorkizuneko jendartearentzat zortzi euroko irabazia izango dela.

Hizkuntza-ereduak aldez aurretik milioika hitzez osatutako testu-bildumekin entrenatuak izaten dira eta entrenamendurako, neurona-sareetan oinarria duten arkitekturak erabiltzen dituzte (gehienetan “transformer” izeneko arkitekturak). Ehunka hizkuntza-eredu daude gaur egun, baita Euskal Herrian euskararako sortutakoak ere (ixa.eus), baina oraingoz ezagunenak, OpenAI enpresak plazaratutako ChatGPTk oinarrian dituen GPT-3 eta GPT-4.

Jar dezagun ChatGPT proban.

- Zer da Irulegiko eskua?

-Irulegiko eskua edo “Irulegi eskua” euskal mitologiako pertsonaia da, Basajaun bezalakoa, baina bera kartsua da eta zaurgarria izan daiteke, eta hainbat ipuin, lekuko eta kontakabuz jorratzen da Euskal Herrian (ikus irudia).

Egia esateko, bi kontuk harritu naute elkarrizketan: I) euskaraz azaleko akats ortografiko eta sintaktikorik gabe eman du erantzuna, eta II) hitz “ezohikoak” erabili ditu (kartsua, kontakabu). Beste hirugarren bat ez zait deigarria egin: erantzunean haluzinatu egin du. Adimen Artifizialean (AA) “haluzinazioa” onargarriak diruditen baina zuzenak ez diren edo testuinguruarekin lotuta ez dauden emaitzak sortzea da. Normalean, adimen artifizialek izan ohi dituzten alborapenengatik, mundu errealari buruz duten ezagutza faltagatik edo entrenamendu-datuen mugengatik sortu ohi dira haluzinazioak. Beraz, ChatGPT, gehienetan, oso zehatza den arren, noizean behin haluzinatu egiten du eta erantzun ez-fidagarriak ematen ditu. Hizkuntza-ereduetan “egiatasuna” (truthfullness) nola gehi daitekeen aztertzea da une honetan ikerketan jorratzen ari den lerroetariko bat.

Baina, orduan, ez ditugu sistema hauek erabiliko? ChatGPT eta antzekoak lagungarriak dira, erabileran dibertigarriak, beti kasu egiten dute eta ia gehienetan erantzun zuzena ematen dute. Beraz, bai, tentuz erabil daitezke. Baina... euskaraz erabili nahi baditugu eta euskal kontuez jakin dezaten nahi badugu, nire ustez egin beharrekoa hizkuntza-ereduak Euskal Herrian sortu, euskaldunon laguntzaz aberastu eta bertan egokitzea litzateke. Baliabide teknikoak eta ezagutza baditugu eta probestu beharko genituzke sistemok euskal kontuekin haluzina ez dezaten. •