«Xuxen aurkeztu eta berehala 4.000 deskarga inguru izan genituen»

Iosu Iturrioz 2015ko abe. 29a, 10:41

Euskal gizartean izandako oihartzunaz harriturik, duela hilabete inguru aurkeztutako Xuxenen bosgarren bertsioak harrera «oso ona» izan duela nabarmendu du Xabier Artola irakasle eta Ixa Taldeko kideak

Hogei urte pasa dira Xuxen euskarazko zuzentzaile ortografikoa sortu zutela. Sarean euskaraz idazten duen ororentzat «tresna ezinbestekoa» dela dio Xabier Artola Zubillaga EHUko informatika irakasleak eta Ixa taldeko kideak. Euskal gizartean izandako oihartzunaz harriturik, duela hilabete inguru aurkeztutako Xuxenen bosgarren bertsioak harrera «oso ona» izan duela nabarmendu du.

Hogei urte pasa dira Xuxen euskara zuzentzailea sortu zenutela. Nola gogoratzen duzu garai hura?
Duela bi hamarkada, Ixako taldekidekok euskararen tratamendu automatikoan ikertzen hasi nahi genuen. Baina itzulpen automatikora edo beste aplikazio aurreratuago batzuetara iritsi baino lehen, oso kontziente ginen hainbat pauso emateko beharraz, besteak beste, euskarazko zuzentzaile ortografikoa sortzea. Egoera horren aurrean, Ixa taldea, UZEI eta Baionako Hizkia bildu eta elkarrekin Xuxenen lehenengo bertsioa aurkeztu genuen. Lehen bertsio horretan, honakoa izan zen gure planteamendua: hitzak soilik ezagutuko zituen zuzentzaile konbentzional hutsa egin beharrean, segmentatzaile morfologiko bat sortzea. Adibide bat jartzearren euskarazko zuzentzaile batek ez du bakarrik 'mendi' ezagutu behar, baizik eta baita 'mendia', 'mendiarekin', 'mendietatik'… ere, hitz bakoitzeko forma ugari ezagutu behar ditu. Puntu horretan ikertzen hastea zen gure helburu nagusia, izan ere segmentatzaile morfologikoa hizkuntza prozesatzeko oinarri-oinarrizko tresna baita.

Zein bilakaera izan du mende laurden honetan?
Lehenengo bertsioa Macintosherako soilik zen. Izan duen bilakaera nagusia egun erabiltzaileak beste hainbat euskarritan (Word, Office, nabigatzaileetan, OpenOffice, LibreOffice, InDesign, Hunspell…) aurkitzeko aukera izatea da. Bestalde, hizkuntza aldetik ere, bilakaera nabaria izan da. Euskaltzaindiak zer esan, berau txertatu dugu. Azken batean, Xuxenek araugintza aurrera doan heinean egokitzen joan behar du.

Aurreko bertsioekin alderatuta, zer gehiago eskaintzen dio bosgarren Xuxenek erabiltzaileari?
Ohartu gara egun Euskal Herrian jende gehienak Microsoften tresnak erabiltzen dituela. Azken urteetan, arazoak izan ditugu gure bertsioak Microsoften euskarrietan integratzeko. Duela urte asko aukera existitzen zen, baina 2008tik hona Microsoft konpainiak ateak itxi ditu bolada batez. Xuxenen bosgarren bertsioaren puntu garrantzitsuena hori da; erabiltzaileak Word 2007, Word 2010 eta Word 2013arekin erabiltzeko aukera duela orain.

Bestalde, erabiltzailearen hiztegia nabarmendu beharrekoa da. Orain arte, Xuxenek pertsona izen zehatzak edota leku izen jakin batzuk ez zituen ezagutzen. Bertsio berri honetan, erabiltzaileak hitz hori bere hiztegi propioan sartzeko aukera du. Une horretatik aurrera, zuzentzaileak hitz horren deklinabide guztiak ezagutuko ditu. Eta hori ez da izen bereziekin bakarrik gertatzen, izen arrunt, adjektibo eta aditzak ere sar baitaitezke hiztegi propio horretan, nahi izanez gero.

Funtzionalitate aldetik aurreko bertsioetan topa ezin zitezkeen bi bereizgarri nagusi daude. Orain arte Xuxenek azpimarra gorriak soilik egiten zituen, oker dauden hitzak adierazteko. Bosgarren bertsioan azpimarra gorri zein berdeak ageri dira. Azpimarra berdeak, bi erabilpen nagusi ditu. Batetik, hitz estandarrak izan arren, Euskaltzaindiak lehenetsiak ez diren kasuetan, Euskaltzaindiak gomendatutako hitzen berri emango zaio erabiltzaileari. Adibidez: 'ainitz' euskara batuan idatz daiteke, baina hobe da 'anitz' idaztea. Bestetik, arazo gramatikalak edota puntuazio arazoak adierazteko ere erabili dugu azpimarra berdea.

Xuxen Microsoften azpiegituran integratzea zergatik izan da hain zaila?
Microsoftek azpiegitura bat eskaintzen du besteen programak beren aplikazioetan integratzeko, eta ezkontza horrek zailtasun handiak ekarri dizkigu. Urte batzuetan Microsoftek bide hori itxi egin zuen. Orokorrean jendeak Worden atzean dagoen zuzentzailea Xuxen dela uste du, baina ez da horrela. Microsoftek eginiko euskarazko zuzentzaile «kaxkar» bat da. Xuxen norberak bere ordenagailuan edukitzeko norberak instalatu behar du xuxen.eus webgunetik. Behin hau instalatuta Wordek dakarkien zuzentzailearen gainetik instalatzen da.

Hala ere, esan izan duzu erabiltzaileak kritikotasunez jokatu behar duela.
Zuzentzaile batek ez du testuingurua kontuan hartzen. Posible da hitz bat okertzat azpimarratzea baina idazleak jakin behar du testuinguru horretan ondo dagoen ala ez. Alderantziz ere gertatzen da, eta maizago, gainera. Hau da, zuzentzaileak ez du hitz bat gorriz azpimarratzen, berez zuzena delako, baina testuinguru horretan ez da zuzena. Kasuak kasu, esaldi aldrebes bat —ni atea ikusi dugu— idatz dezakegu, eta zuzentzaile ortografikoak ez du ezer zuzenduko, esaldia oso gaizki egon arren, lau hitzak zuzenak baitira. Ezinbestekoa da kontuan hartzea zuzentzaile ortografiko batek hitzez hitz zuzentzen duela testua.

Uste duzu posible izango dela etorkizunean mota horretako zuzenketak gauzatzea?
Nik uste bide horretatik doala zuzenketa gramatikala eta estilo zuzenketa. Zuzenketa gramatikalaren alorrean aurrerapenak egiten ari dira. Gure ikerketan ez dugu azterketa morfologikoa soilik egiten, analisi sintaktikoa ere egiten dugu. Itzulpen automatikoa bezalako aplikazio bat egiteko, hizkuntza batetik bestera pasatzeko, esaldi osoa ulertu behar da. Nahiz eta bestelako metodoak badiren, esaterako aski ezaguna den Google-en itzulpen programa. Sistema erabat estatistikoa da, antzerakoak diren bi hizkuntza hautatu eta batak bestearengandik ikasten du, inongo gramatikarik gabe. Benetan gramatika duten sistemetan, sintaktikoki esaldia aztertzea oinarrizkoa da. Etorkizunean sareko zuzentzaileek horrelako zuzenketak egingo dituzte, baita Xuxenek ere.

Zein izan da zure egitekoa proiektu honetan? Nola egiten duzue lan Xuxenen tripetan?
Lehen pausoak, batik bat, analizatzaile morfologikoaren formalizazioan eman nituen. Horretarako, suomierarako garatutako sistema bat hartu genuen eredu gisa. Suomierak eta euskarak antzekotasunak zituztela jabetu ginen; batez ere, morfologia aldetik. Beraz, lehen pausoak horretan egin nituen.

Euskararen datu base lexikalaren kudeaketan ere lana egin dut. Eta azken bertsioan, zuzenki, probatzaile lanak ere gauzatu ditut. Bertsioa probatu, akatsak aurkitu, hobekuntzak proposatu...

Hilabete pasa da zerbitzu berria aurkeztu zenutenetik. Zein harrera izan du jendartean?
Itxuraz, izugarria. Aurkeztu eta berehala lau mila deskarga inguru izan genituen. Baita hainbat galdera, kexa eta iradokizun ere. Azken horiei kasu eginez, bosgarren bertsioaren bertsio berrituagoa prestatzen hasiak gara. Urtarrilerako martxan egotea nahi genuke.

Doako zerbitzua al da? Laguntza ekonomikorik jasotzen duzue?
Lehen bertsioa izan ezik, gainerako guztiak doako zerbitzuak izan dira. Egun, InDesignerako bertsioa soilik ordaindu behar da. Profesionalentzako bertsioa da eta horrenbestez ordaindu beharrekoa. Aipatzekoa da Elhuyarrek, azken bertsio honetan, bere baliabide propioak erabili behar izan dituela proiektua aurrera ateratzeko, ez baitugu diru laguntzarik jaso. Eusko Jaurlaritzak diruz lagundu izan ditu gure proiektu batzuk baina oraingo hau ez.

Aurrerapauso nabariak eman dituzue urteotan. Non dago jomuga? Zer gehiago egin daiteke?
Mugikorretan txertatzea. Nolabait txertatua dela uste dut, baina sisteman txertatzea gustatuko litzaiguke. Bestalde, aurrez esan bezala, zuzentzaile gramatikalaren aldetik, gure bertsio berriek testuingurua gehiago aztertzea dugu helburu.

Ez diogu hau kapritxo hutsagatik: lagun gaitzazu . Eduki hau guztia doan ikus dezakezu euskarazko hitzik gabeko Tolosaldea ez dugulako irudikatzen. Atarikide, iragarle eta erakunde askoren laguntzarik gabe ez litzateke posible hori. Gero eta komunitate handiagoa sortu, orduan eta sendoagoa izango da Ataria: zurekin, zuekin. Ez utzi biharko gaur egin dezakezun hori: egin zaitez Atarikide!


EGIN ATARIKIDE!