Mar 20, 2024

Celebrant el progrés i mirant cap al futur: El viatge d'Awal


Instants de la datathon Awal celebrada el 17.02.2024 a Barcelona.

El tancament de la segona fase del projecte Awal és un moment de reflexió, celebració i anticipació pel que està per venir. Awal s’ha embarcat en una missió crucial: preservar i promoure la llengua amaziga a l’espai digital. Mitjançant el desenvolupament d’eines innovadores, aspirem a facilitar l’ús i la difusió d’aquesta llengua mil·lenària de l’Àfrica del Nord, salvant la bretxa digital i assegurant que les seves parlants no quedin enrere en el paisatge tecnològic, que canvia constantment.

Un gran pas endavant: La iniciativa de recollida de dades

El nostre viatge ja ha assolit fites significatives des que el vam emprendre l’hivern de 2023. Amb la participació entusiasta de la comunitat parlant de l’amazic, hem recollit més de 3.500 frases traduïdes i 2 hores de dades de parla, un corpus de text i de veu que més endavant servirà per poder plantejar la creació de prototips de sistemes de la parla que al seu torn permetin la creació de tecnologies de codi obert com assistents de veu. Aquest primer impuls ha estat possible gràcies als esforços d’una comunitat de dades de nova creació que abasta Catalunya i el Marroc. Un procés facilitat amb el desenvolupament d’un portal web per centralitzar les eines de traducció, validació i enregistrament de frases i l’organització de la primera marató lingüística Awal. El projecte també ha treballat per augmentarla consciència sobre la tecnologia en aquesta llengua marginada, que ocupa el tercer lloc en nombre de parlants a Catalunya, a través de presentacions en diverses activitats i trobades, com les celebracions del Yennayer o Any Nou amazic o el cicle de xerrades “Barcelona, ciutat de 300 llengües.”

Aquests esforços han permès reunir persones, fomentar un sentiment d’orgull i crear eines que reflecteixin la rica diversitat de l’amazic. Fent això, no només estem preservant una llengua sinó també empoderant una comunitat per veure la seva identitat cultural representada i respectada en l’era digital.

Llançant awaldigital.org

En un esforç pioner liderat per la iniciativa Som Part: diversitat i drets col·lectius, d’El CIEMEN, des de Col·lectivaT hem creat i presentat amb orgull el primer lloc web dedicat a la recollida de dades lingüístiques de proveïment participatiu per l’amazic. Aquesta plataforma es presenta com un testimoni d’innovació i representació cultural, representant tots els dialectes i escriptures de l’amazic amb un disseny inspirat en les costums amazigues, gràcies a la tasca creativa de La Clara Comunicació.

Una captura de pantalla de la pàgina web d'Awal a la pantalla d'un ordinador amb el títol awaldigital.org

El lloc web disposa d’una aplicació de traducció automàtica de codi obert, actualment en la seva etapa inicial però prometedora per a millorar amb les dades recollides. Les contribuents poden afegir i traduir frases utilitzant una interfície senzilla, contribuint a la nostra base de dades de frases traduïdes en idiomes com el català, el castellà, l’anglès, el francès i l’àrab. A més de la traducció, el lloc web també promou la recollida de dades de parla, integrant-se amb la iniciativa Common Voice de Mozilla.

La validació comunitària de les dades introduïdes és un pilar fonamental del nostre enfocament, garantint que totes les dades compleixen amb els estàndards de qualitat. Les contribuents són reconegudes per les seves aportacions, guanyant punts per cada contribució i validació, la qual cosa fomenta un esperit de competició amistós mitjançant un sistema de classificació.

El lloc web d’Awal va ser dissenyat per Alp Öktem, responsable de l’eix de tecnologies lingüístiques de Col·lectivaT, i construït per desenvolupador de pila completa Yuxuan Peng, qui actualment el manté i millora de manera voluntària. Servint a la comunitat en cinc llengües — català, castellà, francès, anglès i amazic — l’accessibilitat del lloc web s’amplia, gràcies a l’excepcional treball voluntari de Brahim Essaidi i Yassine Aït-El-Mouden per les traduccions en amazic.

La Marató Lingüística Awal: Un triomf comunitari

La Marató Lingüística Awal va ser la primera d’aquest tipus i l’esdeveniment central d’aquesta fase del projecte. Durant un cap de setmana, la marató va recollir amb èxit més de 1.000 frases traduïdes i una hora de gravacions de veu en amazic. Acollit tant virtualment com presencialment, l’esdeveniment va aplegar parlants de l’amazic de diversos dialectes, edats i gèneres, enriquint les contribucions lingüístiques amb pronunciacions, vocabularis i accents diversos.

Dos col·laboradors discuteixen a la datathon d'Awal sobre diferents guions de Tamazight

Aquesta tasca col·lectiva va mostrar la dedicació de la comunitat a preservar la seva llengua. Participants com Mohamed i Nasseur van treballar junts, navegant pels desafiaments del tifinag, l’alfabet tradicional de l’amazic, i mirant d’encaixar un model estandarditzat de la llengua promogut només des de 2011 al Marroc. Els seus esforços van subratllar una veritat punyent: la llengua amaziga no es promou a les escoles i s’aprèn principalment a les llars i al carrer, a través de l’experiència viscuda. L’esdeveniment també va servir com a recordatori de la vitalitat de la llengua, amb participants com Zaina, que va expressar un orgull feroç en la seva herència i un compromís amb la seva preservació després de passar cinc hores fent contribucions.

La Marató Lingüística, celebrada el 17 de febrer de 2024, a mig camí entre l’Any Nou Amazig i el Dia Internacional de la Llengua Materna, va marcar un pas significatiu cap a la construcció d’un corpus de dades complet per a la llengua d’accés obert. Un procés viu i en progrés, ja que després de l’esdeveniment el lloc web del projecte Awal continua donant la benvinguda a contribucions de tota persona amazigoparlant que hi vulgui participar.

El camí a seguir

A mesura que avancem, el nostre focus es manté clar: continuar promovent la participació al projecte a través dels nostres canals de xarxes socials, millorar els models de traducció automàtica amb dades d’alta qualitat i ampliar la nostra xarxa amb noves participants, lingüistes, expertes en PLN, desenvolupadores tecnològiques i activistes pels drets lingüístics.

És emocionant veure com el nostre viatge ja està fomentant col·laboracions fructíferes. Notablement un dels nostres col·laboradors actius, Mohamed Aymane Farhi, ha desenvolupat un corrector ortogràfic per ajudar a estandarditzar les contribucions. A més a més, una empresa està explorant les nostres dades per desenvolupar un xatbot destinat a assistir el sector agricultor amazigoparlant al Marroc.

Creiem que treballant colze a colze, podem superar els desafiaments de l’exclusió digital i crear un futur on cada llengua, no importa com de desafiant o marginada, tingui el seu lloc legítim a l’arena digital.

Uniu-vos a nosaltres

El viatge d’Awal està lluny de finalitzar. Mirant cap al futur, convidem a unir-s’hi a totes aquelles persones interessades en col·laborar i desenvolupar tecnologia lingüística per l’amazic o altres llengües marginades. Per a més informació o per formar-ne part no dubteu en contactar-nos a awal@collectivat.cat i a través de les xarxes socials de Twitter, Instagram, Facebook i Telegram.

Col·lectivament, assegurem-nos que les veus de totes les comunitats siguin escoltades, respectades i celebrades en el món digital.