Arantza Diaz de Ilarraza Sanchez. Informatikaria

«Itzultzaile automatiko batek ez du sekula pertsona batek bezala itzuliko»

1981etik ari da Diaz de Ilarraza EHUn lanean: euskara informatikan txertatzeko lanean dihardu hasieratik, Ixa taldeko lankideekin batera. Lan andana egin dute: Xuxen zuzentzaile ortografikoa da, ziurrenik, haiek sortutako tresnarik ezagunena.

JUAN CARLOS RUIZ / FOKU.
Maialen Unanue Irureta.
Donostia
2018ko abenduaren 9a
00:00
Entzun
Informatik kontzeptua lehen aldiz erabili zen urte berean jaio zen Arantza Diaz de Ilarraza Sanchez informatikaria (Donostia, 1957): irakasle eta ikerlari ari da EHUn. Berez, matematika ikasi nahi zuen, baina ez zegoen Donostian ikasteko modurik: horregatik ikasi zuen informatika, matematikara gehien hurbiltzen zena hura baitzen. «Ez da oso erromantikoa, baina hala izan zen». Lengoaia eta Sistema Informatikoak sailean dihardu, baita Ixa taldean ere, euskara informatikan txertatzen: haiek sortua da Xuxen, besteak beste.

Ez zitzaizun matematika ikasteko arantza gelditu?

Programatzea gustatzen zitzaidan, eta gustatzen zait oraindik ere. Garai haietan, ez zen erraza programatzea: orain programa egiten duzu, exekutatzen duzu, eta segituan egiazta dezakezu badabilen ala ez. Orduan, ordea, programa prestatzen zenuen, gero hori fitxa batzuetara pasatzen zen, Madrilera bidali, eta hortik hamabost egunera iristen zen emaitza —normalean, txarra; beraz, berriz egin behar zen—. Ez zen oso erraza; gerora, noski, gauzak aldatu dira. Ez zait gustatzen, beharbada, informatika klasikoa, baina bai hizkuntza eta konputagailuak uztartzea; asko gustatu zitzaidan hasieratik.

24 urterekin hasi zinen EHUn lanean: nolakoak izan ziren hasierako urte haiek?

Oso politak: lan asko geneukan, baina oso politak izan ziren. Alde batetik, jende gazte asko sartu ginen, eta lantalde polita osatu genuen: gauzak egiteko, ikasteko, ikasitakoa eskoletara eramateko, graduak berritzeko... Beste aldetik, urte zailak ere izan ziren: hemen ez zegoen baliabiderik. Hau da, bagenekien ikerketa egin behar genuela, baina doktore gutxi zeuden gure tesiak zuzentzeko; beraz, kanpora joan behar genuen. Horrelaxe ibili ginen, tesia egiten, eskolak ematen... Doktore gutxi zegoenez, kudeaketa ere denon artean egin behar genuen.

Interes antzekoak zenituzten taldekideek? Hori izan zen Ixa taldearen ernamuina?

Bai. Lau urtean hamabost pertsona sartu ginen, eta horietatik bostek bagenuen informatika eta euskara uztartzeko gogoa. Gainera, ordurako, baziren gaiari buruzko argitalpenak. Segituan hasi ginen jende gazteagoarekin lanean —gu ere gazteak ginen, baina haiek, gehiago—. Oso esperientzia polita izan zen.

Zuek zeuek ere ikasi egin beharko zenuten, gero beste batzuek zuek izan ez zenuten aukera izan zezaten, ezta?

Noski, noski. Lehenengo urteak halakoak izan ziren; lehenengoak, eta gainontzekoak. Baina orduan, batez ere, ikastaro asko egin genituen, tesia egin eta klaseak eman bitartean. Adibidez, gure tesia —askoren arazoa izan baitzen— ez genuen lau urtean egin, orain bezala: klaseak eman behar genituenez, sei edo zazpi urtean egin behar izan genuen. Nik Bartzelonan egin nuen: astebete pasatzen nuen, bueltan nire lanarekin jarraitu... Denbora dezente egon nintzen horrela.

Informatika gaztelaniaz ikasi behar zen, baina gaur egun euskaraz ikas daiteke osorik. Hori ere zuen gain erori zen, beraz?

Bai, baina gustura egin genuen. Terminologia lantzen hasi ginen,apunteak... Euskarazko ikasgaiak pixkanaka sartuz joan ginen: hamabost bat urte behar izan genituen dena euskaraz eskaini ahal izateko. Guretzat, gainera, oso garrantzitsua da ikerketa eta formakuntza: 2002an hasi ginen UEUrekin berezko titulu bat antolatzen; master bihurtu zen gero, eta, egun, Hizkuntzaren Analisia eta Prozesamendua masterra eta doktorego programa ditugu. Gaur arte, 50 tesi irakurri dira euskaraz. Graduondoko ikasketetan ere indarra jarri dugu, eta ondo atera da, baina jende prestatu gehiago behar da lanerako.

Denbora gutxian, iraultza bat izan da informatikarena: zuei horrek etengabeko formakuntza eskatuko zizuen, ezta?

Bai, pentsatzen dut arlo guztietan gertatuko dela, baina hemen bertigo pixka bat sortzen zaizu ikusten duzulako zer datorren: nondik gentozen, non gauden eta zer datorren. Ikastaroez gain, beti joaten ginen kongresuetara: oso interesgarriak dira ikertzaileentzat, beste leku batzuetan zer egiten duten ikusteko eta haiekin kontaktua egiteko. Etengabe gabiltza horretan: horixe da lan honen alderik politena.

Beste hizkuntza batzuetako ikertzaileekin hartu-emana izatea garrantzitsua izango zen: zeintzuk dituzu gogoan?

Bi maila bereiziko nituzke. Batetik, ingelesarekin harremana izatea derrigorrezkoa da. Ingelesarentzat baliabide asko daude, eta esperimentu asko egin daitezke, beste hizkuntzekin egin ezin direnak, ezta gaztelaniarako ere. Beraz, teknika eta aukera berrienak ezagutzeko, ingelesarekin ikertu behar duzu. Kontua da ingelesarekin egindakoa nola ekarri gurera, zer behar den hori martxan jartzeko euskaraz. Bestetik, beste hizkuntzekin izan dugu harremana, noski; guk euskararako pentsatutako eredua nola esportatu edo proposatu beste hizkuntzekin egiteko, kitxuarekin, bretoiarekin, katalanarekin...

Zuen garaian dena zegoen egiteko: nondik hasi zineten? Zeintzuk izan ziren oinarriak?

Orduan ere itzulpen automatikoa zen izarra, baina prestatzen hasi ginenean konturatu ginen ezin genuela egin hutsetik. Oinarriak finkatu behar genituen, eta proiektu bat planteatu genuen horretarako: lexikoa prestatu, analizatzaile morfologikoak egin, analizatzaile sintaktikoak... Gure estrategia izan da oinarriak jartzea lehenengo, gero, noizean behin, aplikazioren bat sortu ahal izateko, Xuxen bezala: sortu ostean, lantzen eta lantzen jarraitu dugu. Eta hori guztia, maila desberdinetan: momentu haietan ezinezkoa zen pentsatzea semantika lantzea morfologia eta sintaxia landu gabe... Pixkanaka joan ginen oinarriak jarriz, eta, aldi berean, nola aplikatu pentsatuz.

Aldi berean eraikitzen ari zen hizkuntza baten gainean.

Hori da. Morfologia lantzeko beharrezkoa da formalizatzea: morfologiaren kategoriak, lemak eta atzizkiak nola lotzen diren... Hori guztia pentsatu behar duzu. Gainera, sistematizatu egin behar genuen, ordenagailu batek ulertu behar duelako: hor dago desberdintasuna.

Zuentzat oso inportantea izan da informatikariak eta hizkuntzalariak elkarlanean aritzea: zer moduzkoa da lankidetza?

Euskaraz ari ginen denok, baina hizkuntza desberdinak erabiltzen genituen [barreak]. Guk, informatikari gisa, badakigu hizkuntza tratatzen dugula; beraz, gure aldamenean izan behar dugu hizkuntzaz dakien baten bat. Aldi berean, hizkuntzalarientzat lagungarriak dira gure tresnak. Zergatik? Beren teoriak sistematikoago formulatzen laguntzen dielako, hor dago gakoa. Itzulpen automatikoarekin lan egiten baduzu, kontaktuan zaude itzultzaileekin: jakin behar duzu zein arazo duten beren lanean.

Modela aurkeztu berri duzue. Zer moduzko itzulpen tresnak ditu euskarak sarean? Zer dute hobetzeko?

Azken hobekuntzei esker, Modela nahiko ona da, eta abiapuntua baino ez da: ideia asko daude hori hobetzeko linguistikoki, terminologia aldetik... Hamabost edo hogei urte daramatzagu itzulpen automatikoarekin lanean: hasieran, arauetan oinarritutako itzulpen sistemak egiten ziren, eta hor egon ginen; estatistiketan oinarritutako sistemak jarri zirenean, hor egon ginen; orain, sare neuronalekin egiten dira, eta hor gaude. Uste dut emaitza politak emango dituela, eta ikusi behar da jendeak nola erabiltzen duen. Dena den, kontuan hartu behar da itzulpen automatikoa dela: ez du inoiz pertsona batek bezala itzuliko.

Tarteka, zenbait itzulpenek zeresana ematen dute; ez da euskararen kontua bakarrik, ezta?

Zenbat eta testu gehiago izan, sistemak hobeto ikasiko ditu ereduak, eta, horren arabera, hobeto edo okerrago funtzionatuko du. Baina, noski, itzulpen bitxiak edozein hizkuntzatan izaten dira.

Nola definituko zenuke Ixa taldeak euskararen normalizaziorako egin duen lana?

Alde batetik, Xuxen aipatuta, esan behar dugu bere historia, denboran, bat datorrela hizkuntzaren lexiko estandarra finkatzeko Euskaltzaindiak egindako ahaleginarekin. Uste dut oso tresna inportantea dela: guk datu base lexikal bat daukagu, hori da gure oinarria, eta beti akademiak proposatutako berrikuntzak integratu izan ditugu; horrek kostu bat du, baina onartua genuen. Tresna garrantzitsua izan da akademiak erabakitako azken proposamenak gizarteratzeko. Beste alde batetik, tresna gehiago ere egin ditugu: Elhuyar hiztegian integratu genuen gure lematizatzaileak, adibidez, ahalbidetzen zuen bilaketa egitea lemaren arabera eta ez hitzaren arabera. Hori garrantzitsua zen guretzat. Tratatu dugu sintaxia ere, semantika, egin ditugu ontologiak, baita laburpenak automatikoki egiteko sistemak ere... Mila aplikazio daude. Tresna hauek irakaskuntzarako ingurune batean nola aplikatu ere aztertzen ari gara.

Gipuzkoako Aldundiak Ixa taldeari Anton Abadia saria eman zionean, aipatu zenuten asko erabiltzen duzuela «polita litzateke» esamoldea: zerekin amesten duzue orain?

Beste ikerketa talde batekin elkartu gara orain, Aholabekin, eta Hitz Hizkuntza Teknologiako Zentroa sortu dugu; martxan jartzen ari gara. Polita litzateke zentroak arrakasta izatea: alegia, proiektu interesgarriak lortzea, dauden lantaldeak mantentzea edo handitzea, egiten duguna nola gizarteratu aztertzen jarraitzea... Hori da, printzipioz, Hitz zentroaren lehen helburua: elkartu eta proiektuak elkarrekin aurkeztea.

Nolako osasuna ikusten diozu euskarari sarean?

Badaude zaindu beharreko baliabide batzuk: Wikipedia, Dbpedia... Saiatu behar dugu sortzen euskarazko edukiak. Beti gertatzen da: Wikipediara joan, eta, tamainaz, txikiagoa da euskarazkoa; beraz, emaitzak ez dira hain onak. Uste dut horrelako baliabideak zaindu behar direla etengabe: ezin ditugu tresna horiek galdu. Gure algoritmoak, Aholabenak eta Ixarenak, oinarritzen dira testu edo corpus handietan: horiek zenbat eta handiagoak izan, hobeto ikasiko dute algoritmoek. Ahalik eta testu gehien gordez lortzen da hori. Adibidez, itzulpen automatikorako corpus elebidunak behar ditugu: beharrezkoa da sortzen den edukia guztion eskura jartzea, ikerketarako besterik ez bada ere, eta sortzen den hori euskaraz izatea.

Euskaraz, eta lizentzia libreekin.

Gutxi gara, eta dagoen material guztia behar dugu. Daukagun guztia elektronikoki utzi behar dugu, ahalik eta gehien: terminologia, txostenak... Sare sozialetan, hor dago Mastodon; uste dut egitasmo interesgarria dela.

Emakumea eta informatikaria zara: inoiz sentitu zara espezie bitxi batekoa bazina bezala?

Egia esan, ez... Egia da badagoela estereotipo bat informatikariekin lotuta, baina ni ez naiz hor sartzen. Fakultatean kezka handia daukagu, eta lan asko egiten da horren kontra, nolabait. Emakume ikasle oso gutxi dauzkagu, eta ez dakigu zergatik. Batzuetan entzuten da ingeniaritza arloan orokorra dela arazo hori: nire ikasle garaian ez dakit erdira iritsiko ginen, baina ez genbiltzan oso urruti, eta lankideen artean emakume asko gaude. Urte askotan ez da nabaritu desorekarik, kopuruari dagokionez, ikasleen artean, baina orain bai. Momentu batetik aurrera, nabaritu zen jaitsiera: lehen lizentzia bat zen, ingeniaritza bilakatu zen. Pentsatu izan dugu horregatik izandaitekeela: arazoa larria da guretzat.

Ez litzateke lehenago hasi behar estereotipo horren kontra?

Bai... Arazo handi bat dago: jendeak ez dauka garbi zer den informatika. Matematika, fisika edo kimika ikastera sartzen denean, jendeak badaki zertara doan: informatika ez da eguneroko bizitzan —etxeko ordenagailua, eskuko telefonoa...— erabiltzen dugun ingurunea bakarrik, harago doa. Fakultatetik institutuetara joaten gara zer den azaltzera, ez dela jolasa, matematika oinarri handia duela... Baina jarraitzen dugu estereotipoarekin: informatikari bat irudikatzean, mutil bat datorkigu burura, beti ordenagailuarekin dabilena, kasurik egin gabe aldamenekoei... Horrekin moztu behar dugu, baina zaila da: urteak daramatzagu saiatzen.
Iruzkinak
Ez dago iruzkinik

Ordenatu
0/500
Interesgarria izango zaizu
Nabarmenduak
Orain, aldi berria dator. Zure aldia. 2025erako 3.000 babesle berri behar ditugu iragana eta geroa orainaldian kontatzeko.