- Global Voices en Esperanto - https://eo.globalvoices.org -

Tradukaj malfacilaĵoj: kial Google-tradukilo ofte miskomprenas lingvojn similajn al la joruba

Kategorioj: Subsahara Afriko, Niĝerio, Civitanaj komunikiloj, Disvolvado, Ideoj, Komunikiloj kaj ĵurnalismo, Lingvo, Teknikaro, Rising Voices
[1]

Grupo da partoprenantoj de Wikimedia en Niĝerio. Oktobro 2018. Licenco Vikimedia Komunejo [2] CC.BY.2.0.

Ekde apero de Interreto la angla okupis la lokon de la “universala” reta lingvo. En februaro 2020, laŭ WebTech3, pli ol duono [3] de la retejoj en Interreto estis en la angla.

Sed nun en Interreto aperas ĉiam pli da homoj, parolantaj diversajn lingvojn, kio kaŭzis veran lingvan revolucion — ni ekhavis eblecon traduki al la angla el pluraj lingvoj per unu musoklako.

Lastatempe multaj teknologiaj kompanioj klopodas registri ne-anglajn vortojn, trovitajn en Interreto, por ciferecigi tiamaniere plurajn lingvojn. Google  [4][eo], Yoruba Names  [5][en], Masakhane MT [6] [en] kaj  ALC [7] [en] estas inter firmaoj, kiuj klopodas kombini teknologiojn kaj lingvojn, diferencajn de la angla.

Komence de februaro 2020 Google anoncis [8], ke post kvarjara paŭzo ĝi aldonos al Google Translate [tradukilo] kvin pliajn lingvojn, inter kiuj la ruanda [9], ujgura [10], tatara [11], turkmena [12] kaj odia [13].

Sed ĉu okazis al vi, ke post elekti traduk-opciojn vi komprenis, ke traduko al la angla estas en plej bona kazo nur parte akceptebla kaj en plej malbona kazo — tute nekomprenebla? Larĝigo de la lingva gamo alfrontas plurajn kontraŭdirojn kaj malfacilaĵojn [14].

[15]

Viro konfuze legas tekston en Interreto. Foto de Oladimeji Ajegbile. Malferma fonto Pexels.

Tvitero proponas tradukon el la joruba [16] al la angla per la Google-tradukilo kaj kutime la rezulto estas ne tre fuŝa — eble kelkaj vortoj estos tradukitaj ĝuste.

La kaŭzo de tiuj komplikaĵoj radikas en tio, ke teknologiaj firmaoj kutime kolektas siajn lingvistikajn datumojn  [17][en] por traduki el la angla, ĉerpante ilin en Interreto. Por iuj lingvoj tiuj datumoj konvenas, sed la lingvoj kiel la joruba [16] kaj la igba [18], du ĉefaj lingvoj de Niĝerio [19], prezentas malfacilaĵojn pro tio, ke transdonado de tonoj helpe de diakritaj tekstoj en la vortoj povas esti ne kompleta aŭ malĝusta.

Reprezentanto de Google klarigis [20] [en], kial la firmao bezonis kvar jarojn por aldoni kvin pliajn lingvojn:

Google Translate learns from existing translations found on the web, and when languages don’t have an abundance of web content, it’s been difficult for our system to support them effectively. … However, due to recent advances in our machine learning technology, and active involvement from our Google Translate Community members, we’ve been able to add support for these languages.

Google-Translate lernas surbaze de ekzistantaj tradukoj en Interreto kaj kiam lingvoj estas ne sufiĉe prezentitaj tie, tiam estas por nia sistemo malfacile efike subteni ilian tradukadon… Tamen ni sukcesis doni subtenon ankaŭ al tradukoj el tiuj ĉi lingvoj, danke al lastaj atingoj en nia teknologio de maŝina instruado kaj aktiva partoprenado de nia komunumo je Google-Tradukilo.

Krome plejparto de la homoj ne tre lertas pri ortografio en tiuj ĉi lingvoj. Tiuj malkongruoj estas akceptataj de la sistemo, kiu ne markas ilin kiel erarojn, kio sekvigas tradukajn erarojn.

Plejparto de la maŝintradukoj malĝuste transdonas iujn vortojn, speciale se ili rilatas al kulturaj aspektoj. Ekzemple en la joruba signifoj de la vortoj kiel ayaba kaj obabìnrin estas ligitaj al la kultura kunteksto. Plej ofte la maŝintraduko transdonas ambaŭ vortojn kiel “reĝino”. Tamen de la tradicia kaj kultura vidpunktoj diferencigo de tiuj ĉi vortoj tre gravas: obabìnrin signifas “reĝino”, dum ayaba — “edzino de reĝo”.

Sed malgraŭ tiuj tradukaj problemoj, teknologioj helpis antaŭenigi la afrikajn lingvojn en la cifereca mondo, stimulante kreadon de novaj vortoj. La afrikaj lingvoj komencis evolui kun alveno de novaj teknikaĵoj kiel saĝtelefonoj [21] kaj tabulkomputiloj [22], ĉar por nomi tiujn teknologiajn inventaĵojn kaj nociojn, aperas novaj vortoj. Do tiu procezo vastigis uzadon kaj funkciadon de tiuj ĉi lingvoj.

Kun apero de novaj teknologioj vortprovizo de multaj afrikaj lingvoj iĝis pli abunda. Ekzemple en la joruba haveblas vortoj, aperintaj sub influo de la teknologioj, kiel erọ amúlétutù (“klimatizilo”), erọ Ìbánisọ̀rọ̀ (“telefono”) kaj erọ Ìlọta (“dispremilo, pistilo). Same en la igba aperis vortoj kiel ekwè nti (“telefono”) kaj ugbọ̀ àlà (“veturilo”). Tiuj popoloj nomis teknikaĵojn laŭ funkcioj, kiujn ili plenumas.

En jorublingvaj kursoj pri televido kaj reklamo studentoj ekkonas, ke plejparto de la samlingvanoj nomas televidon erọ Amóhùnmáwòrán. Tiu neologismo [23] estigas multe da demandoj kaj disputoj — iuj studentoj opinias, ke videokameraoj kaj aŭtomobilaj videoregistriloj [DVR por aŭtoj] pro siaj funkcioj ankaŭ povas nomiĝi erọ amóhùnmáwòrán.

Tiaj lingvistikaj taskoj en la teknologia sfero utilas por la lingvoj, ĉar ili vekas kritikan pensadon rilate la lingvan kaj teknologian progresojn.

En 2019 Google malfermis [24] [en] sian unuan esplorcentron pri artefarita intelekto [25] en Akrao [26], ĉefurbo de Ganao [27]. Laŭ aserto de CNN [28], ĝi celas ke “Google Trasnlate pli ĝuste rekonu la afrikajn lingvojn”. La esploristo Moustapha Cisse, gvidanta laboron de Google pri artefarita inteligento en Afriko, opinias ke “la kontinento, uzanta pli ol 2000 lingvojn, meritas pli bonan priservadon”, citas CNN.

Antaŭnelonge Mozilla kaj BMZ [29] [en] anoncis kunlaboron pri voĉteknologioj por la afrikaj lingvoj. Danke al tiaj iniciatoj estonte ni povos rakonti pli multe pri esplorado de la afrikaj lingvoj.