gorka julio
IRLEN SAREA

Datuek arduratuta

2018ko abenduaren 8a
00:00
Entzun
Datuek duten garrantziaz hitz egiten da, baina askorentzat oraindik urrun sentitzen den kezka bat da. Pribatutasunari lotuta aipatzen dira datuak batzuetan, beste batzuetan erabilerak eskainiko dituen onurak, negozio aukerak, eta ekarriko dituen antolakuntza modu berrien sorrera. Baina adibideak falta ohi dira. Hona batzuk:

EWKEk —Wikidata baliatuz— literaturarekin egin ditzakeen datu analisiak ikustarazteko lanketa bat egin dut. Hezkuntza programa batekin, Susa argitaletxearekin elkarlanean euskal literaturari buruzko gaiak hobetzeko helburuarekin, Wikidata elikatuz, Wikipedia eta bestelako proiektuak hazteko bidea lantzen ari dira. Gakoa, bi datu base ezberdin bateratzea izan da. Ia 4.600 liburu eta 960 idazle baino gehiago jasotzen dira Armiarma-n, eta orain Wikipediarekin uztartuta dago hori.

Zer nolako azterketak egin daitezkeen artikulu batean bildu du Galder Gonzalezek. Hala ere, artikulu horretan aztertutakoa baino interesgarriagoa litzateke pentsatzea beste zenbait datu ere integra litezke publikoak edo Wikidatarekin erabiltzeko baimenduak balira. Datuak altxor bezala gordetzeko garaiak pasatu ziren, eta datu horiek balio publikoa badute, zabaldu egin behar dira. Datu baseen jabeek ulertu behar dute horrekin datuen balioa ez dela txikitzen, handitu eta hedatu baizik. Proiektu horrek jende askori begiak ireki beharko lizkioke.

Beste adibide bat Deep learning erabiltzen duten teknologien erabilerari lotuta dago. Teknika horiek, egin behar duten lana ondo egiteko, ikasketa prozesu bat behar dute ezinbestean, eta horretarako datu kantitate handi eta formatu egokietan behar dituzte. Datu iturriak publikoak eta erabilgarriak badira, bikain, baina pribatuak badira, ordaintzeaz gain, hortik aterako den emaitza libre izatea zailagoa izan daiteke amaieran. Modela euskara-gaztelera itzultzaile txukunaren kasua da, adibidez.

Irrati batek ere horrelako zerbait martxan jarri duela ere jakin dut. Ahots grabazio pilo bat baliatuz, makina bati esatari baten hitz jarioa ikasarazi, eta orain hark irakur ditzake albisteak, esataria balitz moduan. Datuei buruz ari garenean, etorkizunean teknologia edo aukera hauek baliatuko ote ditugun dago jokoan. Eta ez dut ikusten hori horrela denik.
Iruzkinak
Ez dago iruzkinik

Ordenatu
0/500
Interesgarria izango zaizu
Nabarmenduak
Orain, aldi berria dator. Zure aldia. 2025erako 3.000 babesle berri behar ditugu iragana eta geroa orainaldian kontatzeko.