DigiGlot Newsletter: novigoj en AI alportas bonajn kaj malbonajn novaĵojn por indiĝenaj kaj minoritataj lingvoj

[Ĉiuj ligiloj en tiu ĉi artikolo estas en Esperanto, escepte de tiuj markitaj per [en], kiuj estas en la angla lingvo]

Teknologioj de Artefarita Intelekto [nomata ankaŭ Artefarita Inteligento aŭ Artefarita Inteligenteco, AI] povas interpreti homan lingvon diversmaniere. Tio estigas grandegan interesiĝon pri tiu teĥnikaro. Retbabilaj robotoj, tradukprogramoj kaj inteligentaj helpiloj kiel Siri aŭ Alexa, ĉiuj dependas de la kompreno pri nia uzado de la lingvo.

Antaŭ kelkaj semajnoj, la neprofitcela esplorkompanio OpenAI [en] publikigis artikolon [en] prezentante sian novan metodon por komputa modeligo de la angla lingvo. Pere de sia nova modelo la aŭtoroj donas kelkajn ekzemplojn de kompute generitaj tekstoj, kiuj, laŭ OpenAI, ne distingeblas de homfaritaj. OpenAI decidis ne publikigi la modelon pro timo, ke ĝi povus esti misuzata, ekzemple por krei malicajn robotojn en Tvitero aŭ aliaj sociaj retejoj.

Kiel ĉiam, ĉi tio povus signifi kaj bonajn kaj malbonajn novaĵojn por indiĝenaj kaj minoritataj lingvoj. La bona novaĵo estas, ke ĉi tiu modelo ne bezonas specialajn datumojn por trejni; ĝi konstrueblas kondiĉe ke programistoj havas sufiĉe grandan tekstaron en la cela lingvo (ekzemple Vikipedion). Post kiam modelo estas kreita, ĝi uzeblas por evoluigi pli altnivelajn AI-teknologiojn en tiu lingvo.

Jen kelkaj malbonaj novaĵoj: unue, ĉi tiuj modeloj postulas grandkvantan trejntekstaron, multajn milionojn aŭ miliardojn da vortoj kaj grandegan komputilan kalkulforton. Due, la esplorado en ĉi tiu kampo kutime celas praktike nur la anglan, kaj mankas garantioj, ke la samaj modeloj funkcios bone por pli komplikaj lingvoj.

Ĉiukaze gravas memorigi, ke tiu teĥnikaro uzeblas same facile por profitigi la publikon, kaj por faciligi datumkolektadon al tiukampaj kompanioj.

Tamen, ni esperas vidi pli da esploroj en ĉi tiu kampo por lingvoj, havantaj malpli da rimedoj kaj eventuale AI-teknologion kiuj subtenas tiujn lingvojn.

Aŭskultu la ‘Lastajn Flustrojn’ de formortantaj lingvoj

Plurjarcenta Zen-divenaĵo [en] demandas: Kia estas sono de unumana aplaŭdo?  Ĝi celas liberigi personon de ilia kutima mensostato, por ebligi alian pensmanieron.

Kiam Lena Herzog, plurmedia vida artisto, esploris la tutmondan lingvo-biologian diversecon [eo] kaj vidis ke, kun alarma ofteco*, multaj lingvoj mortas, ŝi decidis prezenti la endanĝerajn lingvojn per drasta kaj nova formo.

[* Unesko: “la indiĝenaj lingvoj malaperas nuntempe laŭ la ritmo de po unu ĉiujn du semajnojn — kio estas neriparebla perdo de la homa heredaĵo”. Uzante la internacian lingvon Esperanto, ni respektas kaj subtenas lingvan kaj kulturan diversecon en la mondo, en la Internacia Jaro de Indiĝenaj Lingvoj 2019]

Ŝi kunmetis sonregistraĵojn de preskaŭ aŭ jam formortintaj lingvoj kaj faritajn per ‘spavoj’ t.e. senpilotaj aviadiloj filmaĵoj de naturejoj, por produkti tion, kion ŝi priskribas kiel “45-minutan mergan oratoraĵon“. [mergado estas la percepto esti fizike ĉeestanta en nefizika mondo]. La rezulto, nomata Last Whispers [en], estas sorĉanta aŭdvida vojaĝo nigre-blanke trairanta la arbaron kun sonoj en la lingvoj tehuelĉa, nivĥa, naŭatla, varlpiria, ajnua, kojuka, nafsana, jul’hoana, surela, ongota kaj kaketa [en]. Kiam tiuj lingvoj perdas siajn lastajn parolantojn, la aŭskultantoj troviĝas en silentega arbaro.

Surmapigo de la originaj lingvoj de Aŭstralio

First Languages Aŭstralia ĵus relanĉis sian retan ilon Gambay [en], kiu montras preferatajn nomojn de indiĝenaj lingvoj, samkiel Torres Strait Islander- lingvoj kaj kie ili respektive situas tra la lando. La vorto Gambay signifas “kune” en la lingvo Butchulla. Konstruita surbaze de Mapbox, malfermkoda mapada platformo, la mapo ebligas al uzantoj trovi lingvajn centrojn, kiuj estas unualokaj en la kampo de lingvorevivigaj klopodoj, kune kun pli bonaj ebloj por enmeti ciferecajn amaskomunikilojn el diversaj fontoj.

Ekrankopio de la Gambay mapo.

Abonu “DigiGlot Newsletter”, la novaĵleteron.

 

Kevin Scannell, Filip Noubel kaj Eddie Avila kontribuis al ĉi tiu raporto kun la redakta helpo de Ellery Biddle.

Komenci konversacion

Tradukantoj, bonvolu Ensaluti »

Gvidlinioj

  • Ĉiuj komentoj estas kontrolitaj de administranto. Ne sendu vian komenton pli ol unufoje ĉar tiu povus esti markita kiel spamo.
  • Bonvolu konduti respekteme al aliaj. Komentoj kiuj enhavas malamajn esprimojn, obscenaĵojn kaj personajn atakojn ne estos aprobitaj.