Euskaltzaindiak Euskararen Erreferentzia Corpusa (EEC) aurkeztu du astelehen goiz honetan, Bilboko bere egoitzan. Andres Urrutia euskaltzainburuak azaldu ditu corpus berriaren ezaugarri nagusiak: «Erreferentzia-corpusa da, alegia, oreka baten bila doana, hizkuntzaren nondik norako zehatzak eta orekatuak bildu nahi dituena, arlo desberdinetako laginak bilduz, egungo euskararen isla emanez. Irekia ere bada, orain arteko materialak bildu dituena eta geroago garrenean ere zabaltzen joango dena, eragile eta material berriekin. Eta, nola ez, kolektiboa da, Euskaltzaindiak Euskal Herriko 68 erakunde pribatu eta publikoekin batera egin duelako, hedabide nagusiekin eta gizarte-eragile askorekin batera».
EECren zimenduak aspaldi jarri ziren, Miriam Urkia euskaltzain oso eta Euskaltzaindiaren Hiztegia egitasmoko arduradunak gogoratu duen moduan: «Euskaltzaindia XX. mendeko 80. hamarkadan hasi zen corpusak lantzen, aitzindaria izan da euskal corpusgintzan. Orotariko Euskal Hiztegiaren corpusa eta XX. Mendeko Euskararen Corpus Estatistikoa ondu zituen aurrena. Ondoren, xxi. mendean sartuaz batera, Lexikoaren Behatokia corpus monitorea osatu zuen. Haingabe Euskaltzaindiak ez zituen izango, esate baterako, Euskaltzaindiaren Hiztegiko hitzak, adierak, erabilera-markak eta horien testuinguruak adierazteko adibideak».
Hala ere, euskararen egunean eguneko erabileraren berri izateko eta hizkuntza-teknologiek ekartzen dizkiguten erronkei aurre egiteko, corpus handiago eta orekatuago baten beharraz jakitun zegoen Akademia, eta orain dela lau urte, hutsune hori betetzeko Euskararen Erreferentzia Corpusa (EEC) abian ipini zuen.
Gaineratu duenez, EECren analisi linguistikorako, ikasketa automatikorako edo hizkuntza-ikerketetan hipotesiak baliozkotzeko «tresna funtsezkoa» da, «baina baita hizkuntza-, literatura- edo ikerketa-helburuetarako corpus estandar edo erreferente gisa erabil litekeena ere. ‘Egungo’ egoera islatzen duen neurrian, hizkuntzaren irakaskuntzan jarduten dutenek, zuzentzaileek… erabilgarri izango dute EEC, lexiko- (orokorra zein terminologikoa) eta gramatika-zalantzak argitzeko, eta, jakina, corpus handi horietarako eredu egokiak balioztatzeko ere bai», nabarmendu du Urkiak.
Horren haritik, euskaltzainburuak ECC corpus orekatua dela adierazi du, eta horretan sakondu nahi izan du euskaltzain gipuzkoarrak: «EEC egiterakoan kontuan izan ditugu oreka eta adierazgarritasuna. Egungo euskararen erabilera islatzeko helburuarekin, garrantzitsuak dira gaien aniztasuna mantentzea, euskalki guztietako adibideak eta testu-iturri desberdinetako (liburuak, aldizkarik, sarea...) edukiak biltzea, eta publiko mota guztiei zuzendutako testuak (gazteak, publiko orokorra, espezialistak) kontuan izatea».
EEC, hizkuntza-, literatura- edo ikerketa-helburuetarako corpus estandar edo erreferente gisa erabilia izan dadin sortu da. Azken 25 urteotako testuak jaso ditu. Lehen bertsio honek 123.124 dokumentu, 154,21 milioi testu-hitz eta 129.817 lema bildu ditu, 2000. urtetik hasi eta 2023ra bitartean euskaraz idatzitako edo ekoitzitako testuetatik hartuak. Urtero eguneratuko da, urtean urteko testuak gehituz eta aurreko urteetako hutsuneak osatuz, ahalik eta erreferentzialtasunik handiena lortzeko helburuarekin.

La exposición temprana a pantallas se relaciona con cambios cerebrales en la adolescencia

Preparándose para confirmar en las urnas la anomalía vasca

Muere un joven motorista de 24 años en un accidente de tráfico en Hernani

Un incendio provoca unos 40 muertos y 100 heridos en una celebración de Nochevieja en los Alpes
