Ander Soraluze: "Euskal komunitatea oso aktiboa da"

Uztarria.eus 2018ko aza. 22a, 18:07
Ander Soraluze. (Julene Frantzesena)

EHUko Ixa ikerketa taldeko kidea da. Hizkuntzaren tratamendu automatikoan egiten du lan, eta euskararen ikerketa aplikatua da taldearen xedea. 2018ko azaroko Uztarria aldizkarirako egin dio elkarrizketa hau Julene Frantzesena kazetariak.

Hamar urte pasatxo daramatza Ander Soraluzek (Azpeitia, 1986) Ixa taldean. Informatikaria ikasketaz, hizkuntzaren prozesamenduaren zientzia esparruan egiten du lan. Euskararen kasuan oraindik ikerketa lan ugari dago egiteko haren arabera.

Zer da Ixa taldea?

Hizkuntzaren tratamendu automatikoan lan egiten duen Euskal Herriko Unibertsitateko (EHU) ikerketa taldea. Euskararen gaineko ikerketa aplikatua du xede nagusia, baina beste hizkuntzen inguruko ikerketak ere egiten ditu taldeak. Ikerketa horietan oinarrituta, baliabide eta aplikazio edo tresna linguistikoak sortzen ditugu.

30 urte dira Ixa sortu zutela. Zu noiz eta nolatan hasi zinen ikerketa talde horretan lanean?

Informatika Ingeniaritza ikasketen bukaerako proiektuarekin murgildu nintzen mundu honetan. Ixa taldean lan egiteko lankidetza beka bat lortu nuen 2008an, eta horrela batu nintzen taldera. Beraz, aurten 10 urte bete ditut Ixa taldean. Ingeniaritza ikasketak bukatu ondoren, Hizkuntzaren Azterketa eta Prozesamendua (HAP) izeneko masterra egin nuen. Master horren helburu nagusia da hizkuntza aztertzea eta hizkuntza hori ordenagailu bidez tratatzeko dauden teknikak eta aplikazioak ezagutzea, eta master horrek ireki zizkidan aurreko urtean defendatu nuen tesia egiteko ateak.

Hizkuntzaren prozesamendu idatzian egiten duzue lan. Zertan datza zure lanak?

Hizkuntzaren prozesamendua edo lengoaia naturalaren prozesamendua bezala ere ezagutzen den zientzia esparruan egiten dut lan. Hain zuzen ere, arlo horrek informatika eta hizkuntzalaritza uztartzen dituela esan daiteke. Lengoaia naturalaren prozesamendua oso mundu zabala da, eta alor asko barnebiltzen ditu. Momentu honetan, zehazki, sintaktikoki etiketatutako euskarazko corpus historikoa osatzeko proiektu batean ari naiz lanean, Baionako Iker ikerketa taldekoekin elkarlanean. Proiektu horren helburu nagusia da euskarazko corpus historikoa sintaktikoki arakatzeko baliabideak prestatzea, ondoren hizkuntzalariek euskal gramatikaren ezaugarri nagusien inguruko azterketak egin ditzaten.

Informatikaria izanda, nolatan hartu zenuen hizkuntzari lotutako ikerketaren bidea?

Beti izan ditut gustuko hizkuntzak, baita informatika ere, eta hizkuntzaren prozesamenduak bi alderdi horiek uztartzeko aukera eskaintzen dit bete-betean. Hala ere, eguneroko jardunean ni gehiago arduratzen naiz proiektuen arlo informatikoaz, nahiz eta hizkuntzaren inguruko oinarrizko ezagutzak beharrezkoak ditudan arlo honetan lan egiteko. Ezagutza hori HAP masterrean lortu nuen.

Besteak beste, hain ezaguna den Xuxen zuzentzaile ortografikoa Ixa taldeak sortua da, baita Matxin gaztelania-euskara itzultzaile automatikoa ere. Zer garrantzia dute halako aplikazioek euskararen sustapenean?

Teknologiak eta horietatik sortzen diren tresnak estrategikoak dira hizkuntzaren etorkizunerako. Euskara bezalako hizkuntza gutxituen kasuan, horien estandarizazioan, normalizazioan eta biziraupenean laguntzen dute tresna horiek, eta lagungarriak dira erabiltzaileentzat.

Azken urteetan itzulpengintza automatikoan hainbat lan egin duzue. Hizkuntza handietan lan horiek nahikoa aurreratuta daude eta emaitzak nahiko txukunak dira. Nolakoa da euskararen kasua? Emaitzak hobetu al dira?

Euskal Herrian bada itzulpen automatikoaren ikerketan punta-puntan lanean ari den jendea. Adibidez, Ixa taldea partaidea den Modela proiektuan aurkeztutako neurona sareetan oinarritutako euskara-gaztelania gaztelania-euskara prototipoak oso emaitza txukunak lortzen ditu. Hala ere, badago hobetzeko aukera, eta horretarako ikerkuntza sustatu, lagundu eta bultzatu behar da. Erakundeen inplikazioa behar-beharrezkoa da horretarako.

Bertsolaritzaren arloan ere egin duzue lanik. Zer, zehazki?

Bai, hala da. Zabalkunde handia izan zuen bi robot bertsotan aritu ziren ekitaldiak. Horren guztiaren atzean hizkuntzaren sorkuntza dago. Lengoaia naturalaren prozesamenduan lantzen den gaietako bat da hizkuntzaren sorkuntza, eta hori Ixa taldearen ikerlerroetako bat da.

Interneten euskara txertatzeko eta teknologia berrien nahiz informatikaren arloak euskalduntzeko lan egiten du Ixak. Zer leku du euskarak gaur egun eremu horietan?

Europako hizkuntzen teknologia aztertzen duen META-NET sareak 2012. urtean egindako azterketa baten arabera, aztertutako Europako 30 hizkuntzetatik 21ek duten babes digitala "hutsala", edo kasurik onenean, "eskasa" da. Euskara 21 hizkuntza horien artean dago, eta ez da azkenetakoa. Euskararen egoera baikortzat jotzen da, baina zuhurtziaz aztertu beharrekoa dela ere argi dago. Islandiera, esaterako, iraungitze digitalera iristeko arrisku bizian dago ikerketa horren arabera.

Informatikaren mundu zabalean erraza al da euskarari tokia egitea?

Ingelesa erabat ari da nagusitzen teknologiaren erabilerari dagokionez. Oinarrian erabiltzen duten teknologia komuna izan arren, hizkuntza bakoitza mundu bat da, formalizazio, tresna eta baliabide bereziak behar dituelako. Oraindik asko dago ikertzeko, eta zer esanik ez euskara bezalako hizkuntza gutxitu baten kasuan. Egoera onean gaude erronka horri heltzeko, aurretik egindako lanean oinarrituta has baikaitezke urratsak egiten. Dena den, mugitu beharra dago atzean ez gelditzeko, eta horretarako ezinbestekoa da erakundeen babesa.

Informatikaren arloan, gainerako hizkuntza gutxituentzat eredu izan al daiteke euskara?

Hizkuntza txikiek baliabide gutxiago izan ohi dituzte. Horrek zaildu egiten du ikerkuntza; izan ere, hizkuntzaren prozesamenduan erabiltzen diren metodo estatistikoek, eta bereziki, azkenaldian modan dauden sare neuronalek corpus edo testu bilduma handiak behar dituzte emaitza onak lortzeko. Edonola ere, euskal komunitatea oso aktiboa da, eta erreferentziazkoa ere bai beste hizkuntza gutxituetako ikertzaileentzat. Beste hizkuntzetarako egindako ahaleginak ez dira alferrik izaten, eta horiek ikasteko ere balio izaten dute. Gauza bera gertatzen da euskararen inguruan egin diren ahaleginekin; horiek ere balio dute beste hizkuntzetarako.

Etorkizunerako zer erronka aurreikusten ditu Ixa taldeak?

Datozen urteetan hizkuntza teknologia ardatz estrategikoetako bat izango da Europan –eta Espainian–, eta inbertsioak egingo dituzte arlo horretan. Euskal Herrian ere pareko plan bat behar litzakete lehenbailehen. Tren hori ez galtzeko, ikerkuntza eta trebakuntza espezializatuak bultzatu behar dira, eta asmo horiek beteko dituen HiTZ (Hizkuntza Teknologiako Zentroa) sortu berri da Ixa taldearen eta AhoLaben ekimenez. Zentro hori erreferentziazkoa izango da ikerketatik lortutako emaitzak gizarteratzerako orduan ere.