NAIZ

Euskaltzaindiak lexikoaren behatokia eguneratu du: ia ehun milioi hitzek osatzen dute orain

Gaur egun, ia ehun milioi testu-hitz ditu Euskaltzaindiaren Lexikoaren Behatokiak. 2009an, lau milioi zeuzkan. Aldian-aldian eguneratzen du akademiak, XXI. mendeko euskararen isla zabala eta gaurkotua izateko helburuarekin, askotariko argitalpenak baliatuta.

Euskaltzaindiaren Lexikoaren Behatokia akademiaren webgunean kontsulta daiteke.
Euskaltzaindiaren Lexikoaren Behatokia akademiaren webgunean kontsulta daiteke.

Euskaltzaindiak Lexikoaren Behatokia gaurkotu du: guztira 98.060.414 testu-hitz dauzka orain. Egitasmoaren helburua da XXI. mendeko euskararen corpus zabala eta eguneratua osatzea. Horretarako material ugari biltzen da: egunkarietako albisteak, aldizkari orokorretako testuak, herri-aldizkari batzuenak, literaturan eta saiakeran ondutako testuak, hezkuntzako materiala, administrazioko materiala...

Corpus etiketatua eta automatikoki lematizatua da, eta horrek modua ematen du hizkuntzaren erabilera hurbiletik jarraitzeko. Gainera, testu-hitzak bilatzeko hainbat aukera eskaintzen du Lexikoaren Behatokiak. Hiru dira nagusiak: bilaketa arrunta, bilaketa aurreratua eta konparazio-bilaketa (formen artekoa, urtez urtekoa). Horiez gain, bilaketa gidatuak egiteko laguntzailea dago.

Akademiaren webgunean kontsulta daiteke.

Hizkuntzaren bilakaera hurbiletik jarraituz

Euskaltzaindiak azaldu duenez, corpusak ezinbestekoak dira edozein ikerketa egiteko. Hiztegia aztertzeko eta lan arauemailea egiteko lana ere corpusetan oinarritu behar da, eta halaxe egin du euskararen akademiak azken urteotan. Testu klasikoak Orotariko Euskal Hiztegiaren (OEH) corpusean ditu bilduta eta XX. mendeko lagin aski adierazgarria XX. mendeko corpus estatistikoan. Bi iturri horiek izan ziren Hiztegi Batua egiteko oinarri nagusiak.

XXI. mendeko beharrei erantzuteko, baina, Lexikoaren Behatokia abian jarri zuen 2008an, «hizkuntzaren bilakaera hurbiletik jarraitu beharra baitago, hitz eta adierazmolde berriak ezagutzeko, arauak zenbateraino betetzen edo urratzen diren jakiteko eta, hori guztia ezagututa, arauak finkatzeko, bai eta hizkuntzaren erabilera sakonago ezagutzeko, gramatika edo estilistika aldetik, erregistroen ezaugarriak aztertzeko edo ikuspegi soziolinguistikotik ikertzeko nahiz edukien ideologia, historia eta abar aztertzeko».

Horrek guztiak badakar corpusgintzan lanean jarraitzea. Euskaltzaindiaren ametsa ereduzko corpus handi, orekatu, lematizatu, etiketatu eta linguistikoki anotatua izatea da, eta badu esperantza amets hori hezurmamitzeko.

Bitartean, Lexikoaren Behatokia izeneko egitasmoan dihardu lanean. Egitasmo horretan, EHUko Donostiako Informatika Fakultateko IXA taldea, Elhuyar Fundazioa eta UZEI ditu bidelagun Euskaltzaindiak. Corpusa elikatzen duten testuak eskuratzeko, berriz, hitzarmenak sinatu ditu akademiak hainbat argitaratzailerekin.