Algoritmo prediktiboak: orojakileak, pertsonalizatuak eta ahalguztidunak?
Gillian Brockell «Washington Post»-eko bideo editorearen istorioa ezaguna izango zaizu, akaso. Orain dela aste batzuk sare sozialetako publizitatera bideratutako algoritmoek izan dezaketen erruki eza azaleratu zuen bere istorio pertsonala azalduz. Gillianek, sare sozialetan oso aktiboa, esperoan zegoen umea hilik jaio eta gero haurdunaldiaren inguruko iragarkiak jasotzen jarraitu zuen. Gainera, horrelako publizitatea jasotzeari utzi nahi ziola adieraztean, erditze ondoko produktuen publizitatea jasotzen hasi zen.
Istorio honen gaineko hausnarketa ezberdinak egin daitezke: enpresek egiten duten datuen erabilera, datuen jabetza, negozio eredua, etab. Artikulu honen helburua ez da horrelako hausnarketa bat egitea, horrelako sistemen barnean dauden algoritmo prediktiboak hobeto ulertzea baizik. Izan ere, algoritmo prediktiboak orojakileak, pertsonalizatuak eta ahalguztidunak direla pentsatu ohi dugu askotan, baina errealitatea bestelakoa da. Algoritmoek akatsak egiten dituzte eta akats horien adibide garbia da Gilliani gertatutakoa.
Algoritmoak ez dira dena jakiteko gai. Algoritmo bakoitzak sarrera datu-multzo batean oinarrituta egiten du lan (erabiltzaileek sare sozialetan publikatutako edukiak, Amazonen egindako erosketak...), datu multzoaren ezaugarriak kodetuz. Kodetzen diren ezaugarriekin ahalik eta kasuistika handiena errepresentatzen saiatzen badira ere, ez da posible dena adieraztea.
Algoritmoak ezin dira guztiz pertsonalizatu. Erabiltzaileei gomendioak bere datuetan soilik oinarrituz ematen bazaizkie, akatsez betetako iragarpenak izango dira ziurrenez. Banakako datuak urriak eta hutsunez beteak direnez, ez dira nahikoak gomendio onak emateko. Horri aurre egiteko, gainontzeko erabiltzaileen informazioa gehitzen da iragarpenak egiteko. Izan ere, errazagoa da nerabeek orokorrean entzuten duten abestia aurreikustea, nerabe batek entzungo duena iragartzea baino.
Algoritmoak ahalguztidunak direla pentsatzea ere ez da egokia. Askotan entzun edo irakurri dugu Google edo IBM-Watson bezalakoek zure adina edota produktibitatea aurreikusi dezaketela. Horrelako baieztapenek gaizki-ulertuetara eraman gaitzakete. Izan ere, ez da gauza bera zerbait aurreikusi ahal izatea edo zehaztasunez aurreikusiko dela esatea.
Azkenik, asmatze-tasa neurtzea garrantzitsua da, baita emaitza positibo-faltsu eta negatibo-faltsuak tratatzea ere. Emaitza positibo faltsuen kasuan, baiezko emaitza bat ematen da, benetan horrela ez denean. Adibidez, minbizia proba baten emaitza positiboa, gaixorik egon ez arren. Emaitza negatibo faltsuen kasuan berriz, algoritmoak ezezko emaitza bat ematen du, benetan eman bada ere. Adibidez, kreditu txartel bidez egindako erosketa bat onartzea, iruzurrezko eragiketa izan arren. Batzuetan ahalik eta positibo faltsu gutxien izatea bilatzen du algoritmo batek, besteetan berriz, ahalik eta negatibo faltsu gutxien izatea. Zeri eman lehentasuna enpresak erabakitzen du eta neurri hori askotan jabeen sustapen-ekonomikoaren arabera ezartzen da.
Algoritmoak nola lan egiten duten modu sakonago batean ulertzeko gai bagara, komunitateak aldaketa berriak proposatu ahal izango ditu eta atsekabea murrizteaz gain, datuen erabilera egokiago bat lortu ahal izango dugu. •