Zientzia

Klik soil bat ahotsa testu bihurtzeko

Elhuyar fundazioak Aditu hizketa ezagutzailea sortu eta kaleratu du: euskarazko eta gaztelaniazko audioak eta bideoak automatikoki transkribatzen eta azpidazten ditu. Adituren teknologia oinarri izan daiteke euskara sartzeko pertsonen eta makinen arteko elkarrekintza ahalbidetzen duten gailuetan.

Igor Leturia, Elhuyarren egoitza nagusian, Usurbilen (Gipuzkoa). JON URBE / FOKU.
jakes goikoetxea
Usurbil
2020ko martxoaren 20a
00:00
Entzun
Erreportaje honen oinarria izan den elkarrizketa Adituren bidez transkriba zitekeen: grabagailuak sortutako WMA audio artxiboa hartu; Adituk onartzen dituen audio formatuetako batera pasatu; ordenagailuko idazmahaitik Adituren webguneko koadrora herrestan eraman; transkribatzeko eskatu; eta kito. Hortxe Igor Leturiarekin izandako 40 minutuko elkarrizketa testu bihurtuta. Di-da batean. Testuari orraztu bat eman, zalantzak eragiten dituzten pasarteak badaezpada entzun, eta moldatzeko prest: moztu, itsatsi, kendu... Pagotxa kazetarientzat. Bizpahiru orduko lana klik bakarrean ia. Horretarako, baina, audioak gutxieneko kalitate bat behar du, elkarrizketa euskara batuan egin behar da...

Aditu. Elhuyar fundazioak sortutako hizketa ezagutzaile elebiduna. Beste era batera esanda, euskarazko eta gaztelaniazko audioak eta bideoak testu bihurtzen dituen plataforma. Audioak transkribatu, eta bideoak transkribatu eta azpidatzi. Audio eta bideo artxiboak izan daitezke. Edota zuzeneko transkripzioa: sakelakoaren edo ordenagailuaren mikrofonoari hitz eginez gero, aldi berean transkribatzen du esandakoa, diktaketa baten moduan.

Beste hizkuntza batzuetan badira halako tresnak. Euskaraz ez zegoen. Elhuyar fundazioko hizketaren teknologien sailak garatu du Aditu (aditu.eus). Sailaren eta Adituren arduraduna da Igor Leturia.

Bai garatzen ari zirenean, bai zerbitzua eskaini eta gero, konturatu ziren hobeto funtzionatzen duela baldintza batzuetan besteetan baino. Hobeto funtzionatzen du, jakina, audioaren kalitatea ona baldin bada. Horretarako, hobe mikrofono txukun samar batekin grabatzea, sakelakoarekin baino. Grabazioa egiten den lekua zaintzea ere komeni da, transkripzioa zailduko luketen zaratak saihesteko. Hobeto funtzionatzen du euskara batuan, euskalkietan baino.

Hitzaldiak, udalbatzarrak...

Ikusi dutenez, Adituk oso ondo funtzionatzen du hitzaldietan, udaletako edo erakundeetako bileretan... «Normalean azpiegitura onak izaten baitituzte, eta, neurri batean, testuak irakurri egiten dituzte». Horrela, osoko bilkuretako eta batzordeetako aktak automatikoki sortuko lirateke.

Zuzeneko ekitaldien azpidatziak sortzeko aukera ere eskaintzen du. Baita itzulpena ere, Itzultzailea.eus itzultzaile automatikoarekin konbinatuta.

Hala ere, horiek ez dira erabilera bakarrak. Zuzeneko transkripzioak balioko luke pantaila edo teklatu baten bidez idatzi ezin duen jendearentzat, audioaren bidez testu bat izateko. Baita, azpdatzien kasuan, gorrentzat ere.

Aditu jendearen eta enpresen esku jarri dute. Transkripzio eta azpidazte zerbitzua eskaintzen du. Hala ere, Adituren oinarrian dagoen teknologia abiapuntua izan daiteke euskarak sarbidea izateko jada merkatuan dauden gailu teknologiko batzuetan: pertsonen eta makinen arteko elkarrekintza ahalbidetzen duten tresnetan. Bozgorailu adimendunetan edo elkarrizketa agente birtualetan, esaterako.

Izan ere, gailu horietan normalean lehen urratsa hizketa ezagutzea izaten da, soinua testura pasatzea. Adituk hori egiten du. «Gero, nahiz eta pertsonak esandakoa testu batean transkribatuta eduki, makina batek ulertu egin behar du», azaldu du Leturiak. «Testua daukanean ulertu egin behar du, jakin behar du zer eskatu diozun, eta horren arabera erantzun, ekintza bat egin».

Bigarren urrats horretan lanean ari dira, makinek euskaraz idatzitakoa ulertu dezaten, eta horren arabera jokatu: «Txatbot deitzen diren teknologiak eta laguntzaileak garatzen ari gara. Horiek geroago etorriko dira». Txatbotak solasean egiteko gai diren programa informatikoak dira. Normalean,enpresek erabiltzen dituzte, bezeroen arretarako.

Adituk euskaraz eta gaztelaniaz funtzionatzen du. Oraingoz. Ingeleseko probak ere egiten hasi dira eta Euskal Herrian frantsesa eskaintzea ere interesgarria dela uste du Leturiak.

Euskaraz, baina euskara baturako dago prestatuta. Zergatik? Honelako transkripzio teknologietan bi fase nagusi daudela azaldu du Leturiak. Lehenengoa, eredu edo ezagutza akustikoa: soinuen uhin segidan fonema ezberdinak ezagutzea. «Makina,k esaten dizu iruditzen zaiola hitz egin duenak tarte batean fonema bat esan duela, hurrengoan bestea bat... Probabilitateen arabera lan egiten du: batzuk ziur esaten dizkizu eta beste batzuk ziurtasun portzentaje apalagoarekin».

Fonemetatik hitzetara

Bigarren fasea, fonema horien probabilitateak edukita, horiek hitz bihurtzea da. Horretarako,testuak baliatzen dituzte: «Fonemak eta fonema bakoitzaren probabilitate segida bat dauzkagu. Horiek testu pila batetik ateratako hitzekin eta hitzen segiden probabilitateekin konbinatuz gero, testua lortzen da».

Euskalkien kasuan, Aditu ez dago prestatuta euskalkiekin bi urrats horiek egiteko. Euskalkiaren ñabardura fonetikoa ez luke ezagutuko, eta egingo lukeen transkripzioa okerra izango litzateke. «Euskalki baterako testu ezagutzailea garatu nahiko bagenu, euskalki horretako grabazioak beharko genituzke, sistema akustikoa eta fonetikoa entrenatzeko», Leturiak zehaztu duenez. Euskalki horretan idatzitako testuak ere beharko lirateke, bertatik hitzak eta hitzen segiden probabilitateak ateratzeko.

Aditu, azken urteetan hizkuntza eta hizketa teknologietan garatu diren hainbat produkturen eta zerbitzuren moduan —Elhuyarren beraren Itzultzailea.eus—, sare neuronaletan eta adimen artifizialean oinarrituta dago.

«Azkenean, sare neuronalen atzean daudenak operazio matematikoak dira», azaldu du Leturiak. «Neurri batean, kalkulu matematiko horiek gure burmuineko seinale elektrikoak imitatzen dituzte». Nodo ezberdinen arteko loturen eta harremanen konbinazioa dira sare neuronalak. Sareak antolatzeko hainbat modu daude.

Sare neuronalena ez da teknologia berria, 1940ko eta 1950eko hamarkadan sortu zen, baina azken urteetan nabarmendu da, lortutako emaitzengatik.

Sare neuronalak entrenatu egin behar izaten dira, ikasteko. Horretarako datuak behar dira, datu pila bat. Garai bateko ordenagailuek ezin zituzten beharrezko datu guztiak prozesatu; gaur egungoek bai. «Gaur egun, bat egin dute sare neuronalen teknologiak eta makina ahaltsuagoek», laburbildu du Leturiak. «Batetik, frogatu da sare neuronalak oso egokiak eta eraginkorrak direla hizkuntza teknologietarako; bestetik, gaur egungo ordenagailuek sare neuronalak askoz ere datu gehiagorekin entrenatzea ahalbidetzen dute. Era honetako teknologiek sekulako jauzia eman dute denbora gutxian».

Entrenatu. Sare neuronalak entrenatu. Adituren kasuan, jakinda hizketaren ezagutzarako zer sare neuronalek funtzionatzen duen ondo, entrenatu egin behar da. Euskaraz. Eta horretarako euskarazko entrenamendu datuak behar dira. «Audioa testu bihurtzea behar dugunez,horrelako adibide pila bat behar dugu: audioak eta haien transkripzioak», Leturiaren esanetan. Grabazio orduak eta milaka esaldi.

Produktuetan integratu

Horiek guztiak sistemari ematen dizkiote eta ikasi egiten du. Behin ikasitakoan, sistemak emaitza onak ematen dituenean, erabiltzeko moduan jar daiteke, Aditurekin egin duten moduan. Erabilera prozesuan sistemak ez du berez ikasten. «Horrek ez du esan nahi, ordea, guk, atzetik, entrenatuko eta hobetuko ez dugunik: testu berriekin, euskalkietako testuekin eta audioekin, audio kalitate ezberdinetarako, fileekin eta elkarrizketa informalekin funtzionatzeko... Eta, zergatik ez, bertsoekin eta kantuekin probatzen hasi. Baina poliki-poliki».

Elhuyarren lana ez da amaitu. «Hainbat proiektu» dituzte Adituren teknologia integratzeko: bozgorailu adimendunak, elkarrizketa agente birtualak, txatbotak... «Adituren aurkezpena hasiera bat da. Hobetu egin nahi dugu eta, beste batzuekin elkarlanean, beste produktu eta zerbitzu batzuetan integratu».

Ildo horretan, ohartarazpen bat egin du Leturiak. Hizkuntzen teknologian aurrerapen asko egiten ari direla denbora gutxian, eta oso zaila dela atzean ez geratzea: «Oso garrantzitsua da euskara hor egotea». Hizkuntza teknologietan eta adimen artifizialean ikertzeko «plan handinahi» bat eskatu zien Jon Abril Elhuyarreko zuzendari nagusiak erakundeei, iragan astean, Adituren aurkezpenean.

Aditu ordainpeko zerbitzua da. Prezioa transkribatu beharreko orduen araberakoa da. Hala ere, probatu nahi duenak aukera du erregistratzeko eta doan probatzeko.
Iruzkinak
Ez dago iruzkinik

Ordenatu
0/500
Interesgarria izango zaizu
Nabarmenduak
Orain, aldi berria dator. Zure aldia. 2025erako 3.000 babesle berri behar ditugu iragana eta geroa orainaldian kontatzeko.