Ezarian. Ahozko sintetizatzaile berria

Ordenagailua giza ahotsarekin

EHUko Aholab ikerketa taldeak ahots bihurgailu bat garatu du, BERRIAren webgune berrituan albisteak irakurtzeko gai izango dena. Kazetaritzaren narrazio estiloan irakurriko duen lehena da.

Lander Muñagorri Garmendia.
2014ko maiatzaren 6a
00:00
Entzun
Ordenagailu bat ari da hizketan pertsona baten ordez. Sarean jarritako albiste bat irakurtzen ari da, baina ez da metalezko ahots mekanikorik entzuten. Atzean geratu da makinen mintzaira halakoa zen garaia, eta egun giza ahotsa entzun daiteke. Hori gertatzen da, bederen, BERRIA egunkariak beta prozesuan jarrita daukan Beta.berria.info webgune berrian. Izan ere, azken uneko albisteak irakurtzeko aukeraz gain, horiek entzuteko aukera ere ematen du sareko atariak. Baina albistea ez du pertsona batek irakurtzen, EHUko Aholab ikerketa taldeak garatutako ahots sintetizatzaile batek baizik. «Teknika oso abanguardista erabili dugu horretarako», azaldu du Inma Hernaez Aholabeko arduradunak. Gainera, inguruko hedabideetan «parekorik ez duen» zerbitzua da. Aplikazio horrek, beraz, «eskuak edo begiak okupatuta eduki arren ere» albisteak entzuteko aukera emango dio erabiltzaileari.

Azken hogei urteetan esparru hori lantzen aritu da laborategia,hau da, testu bat irakurtzeko gai izango den sintetizatzaile edo ahotsak lantzen. Horrela garatu zuten, esaterako, euskarazko lehenengo ahots bihurgailua. Beraz, une honetan martxan dagoen programa azken hogei urteetako lanketaren ondorio dela nabarmendu du Hernaezek. Esperientzia hori guztia klik bakar batean laburbil daiteke. BERRIAren albiste batean sartzearekin batera, ordenagailuko pantailan bozgorailu baten irudia azaltzen da, eta, bertan sakatuta, albiste hori entzun daiteke. «Gure laborategia ikerketan aritzen da batez ere, baina BERRIAk proposamen interesgarria egin zigun, aplikazio oso bat garatzeko eskatu baitziguten». Gustura dago orain arteko ikerketek aplikazio zehatz bat eduki dutelako.

Ordenagailuko aplikazioak giza ahotsarekin irakurtzen dutestu hori, eta horren atzean lan handia dagoela aitortu du Aholabeko arduradunak. Horretarako, lehen pauso gisa arau linguistikoak zeintzuk izan behar diren zehazten diote aplikazioari. Alegia, sintetizatzaileari hizkuntzak dituen bereizgarriak azaltzen dizkiote, eta, horretarako, hizkuntzaren corpusa zehaztu beharra dauka ikerketa taldeak. Izan ere, ahots bihurgailuak jakin behar du soinu kate bat sortzeko hizkuntza horretan zein azentu erabiltzen den. «Soinu bati hitzaren lehen silaban azentua edukitzea dagokio agian, baina hitz hori bera esaldiaren leku batean edo bestean egon, doinu ezberdina dagokio». Horregatik, Hernaezek dio lehen fase hori dela garrantzitsuena, esaldiak zein eratan irakurri behar diren zehaztu behar baitzaio programari.

Kazetaritza narratiboa

Aplikazio honetan, gainera, lehen pauso hori oso konplexua izan dela adierazi du Hernaezek, «egunkari bateko hizkuntza oso aberatsa delako». Besteak beste, atzerriko pertsonen izen-abizenak, siglak, zenbakiak eta kirol emaitzak irakurtzeko moduak nolakoa izan behar duen azaldu behar izan dutelako. Baina, horrez gain, berezitasun bat ere sartu diote: kazetaritzaren ezaugarri narratiboetara egokitu dute irakurketa. Orain arteko ahots sintetizatzaileek testua esaldika irakurtzen zuten. Aholaben lanketarekin, ordea, «ahotsak parrafo osoa irakurtzen du». Beste era batera esanda, doinua nola eman eta irakurketaren jarraipena egiteko modu berri bat landu dute. «Guretzat oso zati polita izan da hori, berritzailea delako, eta erronka baten moduan hartu dugu».

Hori horrela izan dadin, gainera, ereduak ere hartu dituzte. Hain zuzen ere, ETB1eko albistegietako hainbat bideo aztertu dituzte Aholabeko laborategian, eta melodia eredu estatistikoaren arabera ikertu. Doinuaren gorabehera zein izaten den ikusi dute horrela, eta kazetaritzaren ezaugarri narratiboak zeintzuk diren estatistikoki landu. Martxan jarritako ahots bihurgailuak, beraz, albistegietako doinuarekin irakurtzen ditu BERRIAko webgunean jarrita dauden albisteak. «Albisteak irakurtzeko doinu egoki bat behar da, eta hori lortu nahi izan dugu kasu honetan».

Ahotsa grabatzen

Programak izan beharko lituzkeen arau linguistikoak zeintzuk diren zehaztu ondoren, seinale akustikoak grabatu zituzten. Kasu honetan, 2.000 esaldi artean irakurri behar izan dituzte bi hizlari profesionalek. «Ahotsaren tonua eta abiadura berdin mantentzen saiatu behar dute». Eta, horregatik, oso prozesu nekagarria izan dela aitortu du Hernaezek.

Behin grabaketa horiek egin ondoren, ordenagailuek esaldi horiek moztu egiten dituzte, parametro akustiko batzuen arabera. Eta hortik parametro horiek testuarekin elkartzen ditu aplikazioak. «Iraganean, silaba eta soinu ezberdinak hartzen zituzten ahots sintetizatzaileek, eta bata bestearen atzetik itsasten zituen». Aholab ikerketa taldeak garatu duen proiektua, ordea, horretan ere berritzailea izan da. «Orain, ahotsa sortzeko metodoa ez da zuzenean uhina hartu eta batea bestearen ondoren itsasten den prozesu etengabe bat; parametro akustikoak kalkulatu, eta hortik sortzen dugu uhina». Alegia, aurretik landutako corpusa kontuan hartzen du zein doinu eman behar zaion jakiteko.

Horren ondorioz, azken proiektu horren ahots uhin naturalago bat lortu dela nabarmendu nahi izan du Hernaezek. «Une honetan puntan dagoen aplikazio bat da», esan du. BERRIAko webgunean kargatuko diren albisteak euskara batuan irakurriko ditu aplikazioak, eta ildo horretan bakarra ere bada. Edonola ere, Aholabeko arduradunak argi utzi nahi izan du proiektuko ahotsa ez dela pertsona jakin batena, hainbat pertsonak egin dituzten grabazioen artetik sortutako ahots sintetiko bat baizik. «Beraz, inorena ez den ahots batek irakurriko ditu albisteak». Inorena eta era berean denena den ahots batek, hain zuzen ere. Abian da albisteak irakurtzeko espresuki sortu den ahots berria.
Iruzkinak
Ez dago iruzkinik

Ordenatu
0/500
Interesgarria izango zaizu
Nabarmenduak
Orain, aldi berria dator. Zure aldia. 2025erako 3.000 babesle berri behar ditugu iragana eta geroa orainaldian kontatzeko.