Iñigo Cobian
BC3ko arduradun teknikoa

Datu irekien garrantzia ikerketan

2025eko azaroaren 28a
05:00
Entzun 00:00:00 00:00:00

Zientzia aurrera doa datuei esker: azterketa genomikoak, satelite-irudiak... denak dira ezinbestekoak nork bere ikerketa esparruan ezagutzan aurrera egiteko. Urtero inoiz baino datu gehiago sortzen direla jakinda, badirudi ikerketa zentroetan gauden langileak zorioneko gaudela. Baina datuak izate hutsak ez du esan nahi aurrerapen zientifikoan laguntzen dutenik. 

Oztoporik argienetako bat lizentzia da: datu horiek erabiltzeko aukerarik ematen ez duen erakunde batekoak badira, ezer gutxirako balio digute. Beharrezkoa da horiek banatzea eta aldaketak egitea onartzen duten lizentziak erabiltzea. Horregatik, funtsezkoa da konfidentzialtasun-murrizketarik ez duten datuek sarbide askeko lizentziak izatea; bai erakunde publikoetakoek, bai ikerketa-zentroetakoek, bai enpresa pribatuetakoek ere. Hala ere, horiek erabiltzeko borroka ez da lege-eremura mugatzen.

Beste oztopo argi bat da ez dagoela estandar bakar bat datuak antolatzeko orduan. Alde batetik, formatu eta jatorri ugari dituztelako, eta, bestetik, planifikaziorik ez dutelako beste norbaitek berrerabiltzeko. Arazo horri elkarreragingarritasunik eza esaten zaio, eta ez du konponbide errazik. Estrategia bat da datuak etiketatzea eta antolatzea, haien esanahia sendoa eta argia izan dadin, askotariko sistema eta tresnek, adimen artifiziala barne, erraz integratu ahal izan ditzaten.

Datuek esanahi ezaguna izateko estrategia nagusia metadatuak erabiltzea da, datuei buruzko informazioa. Ez da nahikoa datuak deskribatzea, hala nola artxiboaren pisua, azken aldaketaren edo luzapenaren data: gehiago behar da. Komunitate bakoitzak bere jardunbide egokiak izango ditu, eta, beraz, zaila da kasu guztiak modu orokor batean biltzea. Hala ere, badira gehienetan betetzen diren printzipio gidari batzuk. Hau da, gizakiek zein makinek interpreta dezaketen lengoaia bat erabiltzea, edo garrantzitsuak izan diren elementuei erreferentzia egitea. Adibidez, datuak sortu zituzten egile edo erakundeen identifikatzailea, erabilitako ereduak edo jatorrizko datuak gordetzen dituzten biltegietarako estekak dira jarraitzeko moduko printzipio gidari batzuk.

Izendapen berria

Ez dago zertan etiketatze guztiak metadatuekin egin. Horien deskribapen semantiko batek, ontologia publiko baten bidez kategorizatuz, haien arteko erlazio logikoak automatikoki sortzeko aukera ematen du, inferentzia-arauei esker. Tresnaren mugen berri jakinda, teknika horren aplikazioa errazteko aukerak sortu dira.

Datuen ekoizpena ez da eraginkorra datuak berrerabili ezin badira: eskuragarri, irekita eta egituratuta egon behar dute, besteek horiekin lan egin ahal izateko. Horrela bakarrik bete ahal izango dute zientzian izan beharko luketen rola: ezagutza berria sortzeko oinarri gisa balio izatea, gure helburuetan aurrera egiteko.

Iruzkinak
Ez dago iruzkinik

Ordenatu
0/500
Interesgarria izango zaizu
Nabarmenduak
Kazetaritza propio eta independentearen alde, 2025 amaierarako 3.000 irakurleren babes ekonomikoa behar du BERRIAk.