EHUren Euskara Institutuak corpus berri bi aurkeztu ditu

XXI. mendeko testuen corpusik handiena berritu dute, eta hizkuntzak alderatzeko berri bat sortu. Jaurlaritzak diruz lagundu ditu
Patxi Baztarrika Hizkuntza Politikarako sailburuordea eta Pello Salaburu Euskara Institutuko zuzendaria.
Patxi Baztarrika Hizkuntza Politikarako sailburuordea eta Pello Salaburu Euskara Institutuko zuzendaria. M. RAMIREZ / ARP

Ibai Maruri Bilbao -

2016ko maiatzak 7
HAC Hizkuntzen Arteko Corpusaren eta ETC Egungo Testuen Corpusaren bertsio gaurkotua aurkeztu ditu EHU Euskal Herriko Unibertsitateko Euskara Institutuak. Sarean daude atzotik. Pello Salaburu institutuko zuzendariaren esanetan, hizkuntzak lan tresna gisa dituzten profesionalentzat oso baliagarria izango da corpus berria; baita itzultzaile, irakasle, idazle eta ikertzaileentzat ere. Tankera horretako beste corpus batzuekin alderatu ditu, eta, haren esanetan, «onenak» dira atzo aurkeztu zituzten biak.

Kasurako, Egungo Testuen Corpusak XXI. mendeko testuak biltzen ditu. «Nik dakidala, RAE [Espainiako Errege Akademia] da antzekoa duen bakarra. Gureak hitz kopuru gehiago ditu, urteka oreka handiagoa dauka, eta askoz erabilerrazagoa da». Hasiera batean 205 milioi hitz zituen, baina atzo aurkeztutako bertsio eguneratuari beste 65 milioi gehitu dizkiote.

Euskaraz dagoen corpusik handiena da. Mende honetan sortutako testuak dauzka gordeta. Besteak beste, euskaraz idatzitako liburuak eta prentsan argitaratutako artikuluak jasotzen dituzte. Aukeraketa bat egin dute. «Oraingoz gure hizkuntzaren egoerak testuak hautatzera behartzen gaitu, corpus batean testu zuzenak sartu behar direlako, eta, gure kasuan, beti ez dira txukun idatzita egoten».

Lau hizkuntza

Hitzei buruzko informazio zabala ematen du. «Adibidez, biktima hitza bilatuz gero, 40.000 testutan dagoela ikusiko dugu. Eta, urtez urteko bilakaeraren grafikoari esker, ikusiko dugu azken urteetan gero eta gehiago erabiltzen den kontzeptu bat dela».

Hizkuntzen Arteko Corpusak, berriz, lau hizkuntza parekatzen ditu, testu berberekin: euskara, gaztelania, frantsesa eta ingelesa. Parekoak diren testuetan idazle bakoitzak hitza nola erabili duen ikusten da. Horregatik corpus hori itzulpenak egiteko «oso ona» dela iruditzen zaio Salabururi. «Itzultzaileen lan egokia erakusten du, eta batzuetan ezinbestean egin behar diren tranpatxoak ere agerian uzten ditu».

Eusko Jaurlaritzako Hizkuntza Politikarako Sailburuordetzak diruz lagundutako proiektuak dira Euskara Institutuaren corpus horiek. Patxi Baztarrika sailburuordeak emandako datuen arabera, urtero, batez beste, 28.700 jasotzen dituzte egitasmoek. «Tresnek euskarari egiten dioten ekarpenari erreparatuz gero, oso inbertsio errentagarria da».

Irakurle agurgarria:

Honaino iritsi zarenez, eskaera bat egin nahi dizugu: irakurtzen ari zaren edukia eta egunkaria babestea, konpromiso ekonomikoa hartuz. Publizitatea eta erakundeen diru-laguntzak ez dira nahikoa BERRIAren etorkizuna bermatzeko. Sarean eskaintzen dizugun edukia irakurtzen duzuen milaka irakurleek proiektuari ekarpena eginda, urrutira iritsiko ginateke.

Kazetaritza libre, ireki eta independentea egin nahi dugu euskaldunontzat. Euskaraz informatzea delako gure eginkizuna, eta zure eskubidea.Lagun gaitzazu bide horretan. Idatzi gurekin etorkizuna. Geroa zugan.

Martxelo Otamendi
BERRIAko zuzendaria

Izan zaitez BERRIAlaguna