Europa press

Logo ep

    Investigadors de la UPV desenvolupen un nou traductor automàtic de llengües minoritàries

    12:3024.05.2012

    VALÈNCIA, 24 (EUROPA PRESS)

    Investigadors del grup Pattern Recognition and Human Language Technologies (PRHLT) a l'Institut Tecnològic d'Informàtica de la Universitat Politècnica de València han desenvolupat un nou traductor automàtic de llengües minoritàries, que permet superar l'escassetat de recursos lingüístics dels traductors actuals i facilita la interpretació dels textos, siga quina siga la llengua que en la qual estiguen escrits, aprofitant la similitud d'esta amb altres llengües.

    Els responsables del nou mètode de traducció, Luis Leiva i Vicent Alabau, han explicat en un comunicat que el seu objectiu és "ajudar a entendre aquelles llengües que actualment no són capaços d'abraçar els traductors, i contribuir així a la preservació de cultures i l'eliminació de barreres lingüístiques".

    Actualment es calcula que més del 10% dels llenguatges del món no poden ser assistits per cap sistema de traducció, ni tan sols utilitzant llenguatges intermedis per als que sol haver més recursos. Per exemple, per a traduir de francés a zulu se sol passar per l'anglés (això és, es traduïx de francés a anglés i després d'anglés a zulu).

    Fins i tot per als llenguatges majoritaris en ocasions és complicat abraçar tot el coneixement lingüístic, donat el seu constant creixement i enorme evolució. Segons apunten Luis i Vicent, això dóna lloc a un fenomen bastant freqüent en els traductors automàtics: quan el sistema no té informació sobre algunes paraules, les deixa sense traduir. "Per tant, en el cas extrem de no tindre dades sobre cap de les paraules a l'idioma origen, el sistema perd tota utilitat i el missatge no pot ser transmès", han explicat.

    Per a resoldre este dèficit, el sistema ideat pels investigadors del PRHLT-ITI incorpora en les traduccions informació de llenguatges relacionats amb l'idioma destí, aprofitant la similitud gramatical i sintàctica que existix en les famílies de llenguatges.

    "La idea consistix a escollir aquelles paraules d'altres idiomes per als que es puga generar una traducció automàtica, de manera que s'assemblen tant com es puga a l'idioma destí, que és l'idioma de l'usuari que vol entendre el missatge. Si bé les frases resultants poden semblar estranyes a primera vista, ja que gramaticalment són una barreja de diversos idiomes, en realitat són prou entenedors per a un parlant de la llengua destí", destaca Luis Leiva.

    FUNCIONAMENT

    Per a explicar el funcionament i la utilitat del nou traductor, els investigadors de la UPV exposen el següent cas: imaginem que una persona que només parle espanyol volguera entendre la frase "another label with the same name already exists", i que l'espanyol fora un idioma per al que no existiren traductors automàtics.

    En este cas el sistema buscaria possibles similituds a l'italià, portugués i francés --totes elles llengües idil·lis-- per a les que sí pot generar traduccions automàticament i construïx en primer lloc traduccions d'anglés a italià, portugués i francés. A continuació, les tres traduccions es combinen estadísticament perquè el resultat siga semblant a l'espanyol.

    "Així, la frase anterior es traduïx per "Un'altra étiquette con mesmo nome existe déjà", que no és espanyol però permet a un espanyol entendre el missatge original sense necessitat de dominar cap dels tres idiomes auxiliars; això hauria estat impossible de fer mitjançant sistemes de traducció automàtica actuals", apunta Vicent Alabau.

    Entre els seus avantatges, este nou traductor, en el perfeccionament del qual seguixen treballant els investigadors de la UPV, facilitaria l'accés a continguts digitals (llibres electrònics, llocs web, etc.) que no poden ser traduïts a certes llengües, afavoriria també la integració social de parlants monolingües i ajudaria als usuaris a adquirir soltesa i familiaritzar-se amb el vocabulari d'altres llengües.

    INSPIRACIÓ EN BLADE RUNNER

    Per al seu desenvolupament, els investigadors de la UPV es van inspirar en la pel·lícula Blade Runner, en què alguns personatges utilitzaven un argot anomenat "Cityspeak" ("Interlingua" en la versió espanyola de la pel·lícula), una barreja d'idiomes, que incloïa, entre d'altres, japonès, espanyol i alemany. Este argot sorgia a Los Angeles com a conseqüència d'un creixent entorn multicultural.

    "Diàriament molta gent incorpora paraules estrangeres en les seues converses, bé per familiaritat o freqüència d'ús, però també perquè a vegades un altre idioma té un terme més precís per a definir un concepte", expliquen Luis Leiva i Vicent Alabau.

    "Això ens va portar a pensar que seria bona idea usar llenguatges semblants als d'un grup de parlants per suplir la falta de recursos en traducció automàtica; de manera que, al contrari que Cityspeak, el llenguatge barreja no ha de ser aprés perquè està orientat al llenguatge dels esmentats parlants", conclouen els investigadors de la UPV.

    Resum

    • Última Hora

      • Espanya

        • Món

          • Economia

            • Cultura

              • Societat

                Cercador

                Últimes notícies