Interneteko bilatzaileak ere euskaraz

Erabiltzailearen aurpegia Saroi Jauregi 2018ko mar. 6a, 11:54

Zenbat aldiz gertatu zaizu Interneten zerbaiten bila ibili eta aurkitu ezinik amore ematea? Bilaketak erdaraz egiten badituzu, ez zitzaizun askotan gertatuko beharbada, baina euskarazko zerbaiten peskizan ibili bazara, seguru behin baino gehiagotan gertatu zaizula.

Izan ere, sareko bilatzaile gehienek ez dakite ondo euskaraz, eta ez dute ulertzen hitz berak hainbat forma izan ditzakeela testuinguruaren arabera (ditxosozko deklinabidea!), edo ez dituzte forma guztiak aurkitzen.


Baina badago konponbidea horretarako. Elhuyarreko Hizkuntza eta Teknologiako lantaldeak Xenda euskarazko bilaketa-sistema garatu du. Xendak, besteak beste, lematizatu egiten ditu bilaketak; hala, deklinatutako hitz bat bilatu arren, oinarrian duen hitza bilatzen du, eta, emaitza adierazgarrien rankinga sortzeko, haren konbinazio posible guztiak hartzen ditu aintzat.


Xenda bilaketa-sistema euskarazko hainbat webgunetan dago inplementatuta, eta oraintsu Tolosaldeko Atariaren webgunean eta Tokikom elkarteko kide diren beste 15 komunikabide digitalen webguneetan txertatu da:


Alea: https://alea.eus/
Aiaraldea: https://aiaraldea.eus/
Aikor: https://aikor.eus/
Anboto: https://anboto.org/
Ataria: https://ataria.eus/
Baleike: https://baleike.eus/
Erran: https://erran.eus/
Euskalerria irratia: https://euskalerriairratia.eus/
Goiena: https://goiena.eus/
Guaixe: https://guaixe.eus/
Hiruka: https://hiruka.eus/
Karkara: https://karkara.eus/
Maxixatzen: https://maxixatzen.eus/
Plaentxia: https://plaentxia.eus/
Uriola: https://uriola.eus/
Zarauzko Hitza: https://zarauzkohitza.eus/
 
Webgune horietan guztietan, Google-ren bilatzailea erabiltzen zen orain arte. Horrek hizkuntzaren gaineko behar besteko zehaztasunik eza zekarren batetik, eta, bestetik, bilaketaren emaitzak ordenatzeko Googleren irizpideak erabiltzeko betebeharra. Azken bertsioak publizitatea txertatzen zuen gainera.


Orain, ordea, 16 webgune horiek Elhuyarren Xenda teknologia dute bilaketetarako. Horrek asko errazten dizkie gauzak erabiltzaileei, asko hobetzen du haien esperientzia, eta webguneen arduradunek bilaketen emaitzak ordenatzeko irizpideak zehazteko autonomia dute.


Sistema berrian, bilatu nahi dugun hitza idazten hasi ahala, «autocomplete» aukera aktibatzen da, eta hainbat aukera agertzen zaizkigu zerrendan, guk hitz osoa idatzi behar izan ez dezagun.

Funtzionalitate hori ere, lematizazioa bezala, euskarara egokitua du Xendak, eta bilatzen ari garen webgune horretan bertan noizbait agertutako hitzak dira proposatzen dituen guztiak. Funtzionalitate horrek badu beste abantaila bat ere, gure akatsak detekta ditzake. Alegia, bilatu nahi dugun hitza oker idazten badugu, ez du aurkituko, baina haren antzekoak proposatuko dizkigu, eta tartean egongo da hitz egokia.


Horrez gain, lematizatu egiten ditu bilaketak, eta euskaraz hitz batek izan ditzakeen forma guztiak bilatzen ditu, nahiz eta guk haietako bakarra idatzi.


Bilaketak eremu (izenburua, testua, egilea…) eta testu-mota (hitzorduak, artikuluak, audioak…) jakin banatara mugatu ditzakegu, edo guztietan batera bilatu. Eta epe jakin bat ere zehaztu dezakegu, bilaketa doitzeko.


Bestalde, 16 webguneetako emaitzak bistaratzea edo webgune jakin batekoak ikustea hauta dezakegu. Eta emaitzak berritasunaren eta/edo antzekotasunaren arabera bistaratzeko eska diezaiokegu sistemari.


Ze garrantzitsuak diren lupa txiki horren atzean dauden hizkuntza-teknologiak, ezta?

Ez diogu hau kapritxo hutsagatik: lagun gaitzazu . Eduki hau guztia doan ikus dezakezu euskarazko hitzik gabeko Tolosaldea ez dugulako irudikatzen. Atarikide, iragarle eta erakunde askoren laguntzarik gabe ez litzateke posible hori. Gero eta komunitate handiagoa sortu, orduan eta sendoagoa izango da Ataria: zurekin, zuekin. Ez utzi biharko gaur egin dezakezun hori: egin zaitez Atarikide!


EGIN ATARIKIDE!