INFO

Aurrerapen garrantzitsuak EHUn adimen artifizialaren ohiko bi arazoren aurrean

«Machine Learning» edo ikasketa automatikoaren arloan oso ohikoak diren bi arazorentzako irtenbideen bilaketan aurrerapen garrantzitsuak egin ditu Jonathan Ortigosa EHUko informatika ingeniariak.


EHUko Donostiako Informatika Fakultateko Konputazio Zientzia eta Adimen Artifizialaren saileko Jonathan Ortigosak egin duen ikerketa lana ikasketa automatikoan oinarritzen da. Etiketatze ezaguneko datu gutxi izatea da “Machine Learning” arloan oso ohikoak diren arazoetako bat, eta ikasketa erdigainbegiratuan erabiltzen da, ordenagailuak sailkapenak ongi egiten ikas dezan.

Beste arazoak klase desorekarekin du zerikusia. Mota bateko datu etiketatu asko dago, eta oso gutxi, beste mota batzuetakoak; eta horrek ereduek okerreko ondorioak ateratzea eragiten du. Informatika ingeniariak azaldu duenez, «erronka handiak» dira egun komunitate zientifikoan, «etengabe azaltzen baitira ikasketa automatikoari dagozkion problemetan».

«Alor honetan saiatzen gara datu asko erabiltzen, ordenagailuak haietatik ikasteko eta automatikoki sailkapena egiteko gai izan daitezen horretarako berariaz programatu gabe», adierazi du Ortigosak.

“Sentiment analysis” edo sentimenduen analisiarekin lotutako lan batekin hasi zen. «Produktu jakin batzuen inguruko blog batzuetako artikuluak karakterizatzeko lan bat izan zen; jakin behar genuen ea testuak objektiboak edo subjektiboak ziren, balorazio positiboak edo negatiboak zituzten», azaldu duenez.

Bereizten irakatsi

Gaiari buruzko ikerketa teoriko eta matematikoa egin zuen, eta aztertu zuen zein den datu etiketatu kopuru txiki jakin baterako proposa daitekeen algoritmo erdigainbegiratu egokiena, eta zer errore eragingo lukeen. Horrekin kalkulatu zuten zein litzatekeen halako problema motarentzat proposatzen den edozein algoritmorekin lor daitekeen errorerik txikiena.

Ortigosak zehazten duenez, era horretara «jakin dezakegu ea datu kopuru jakin bat nahikoa izango den ehuneko jakin bateko igartze maila lortzeko. Orduan, proposatutako soluzioaren egokitasuna kalkula daiteke».

«Haurrei txakurrak eta katuak bereizten erakusten zaien bezala irakasten zaie ordenagailuei», azaldu du ikertzaileak, eta gaineratu du «txakur asko eta katu bakar bat erakusten» badizkiegu, litekeena dela «haien arteko aldeak ondo ez ulertzea edo okerreko ondorioak ateratzea». Nolanahi ere, ikertzaileak dioenez, ikasketa automatikoan «eragin larriak izan ditzake enpresa batean ordenagailuak okerreko ondorio bat ateratzeak».

Horrenbestez, metrika bat proposatu zuten neurtzeko «ereduak ikasteko erabiltzen diren datuek zer desoreka maila duten edo datuen etiketa motetan zer alde dagoen. Desoreka maila hori lotuta dago erabilitako datuen arabera proposa daitekeen soluzioaren errendimenduarekin».

Ikerketa lan honetan, arazoen ebazpen praktikoa bilatzeaz gain, ikerketa teorikoa egin du Ortigosak: «matematikoki modelatu» ditu bi problemak, «haiek kontrolatu ahal izateko, eta, gero hori guztia benetako arazoetako soluzioa proposatzeko unean erabiltzeko».