Una reforma ortogràfica impròpia de l’era digital

  • «Per a ser viva, una llengua ha de ser viva en el món digital, en el món d’internet»

Mikel L. Forcada
13.11.2016 - 22:00
Actualització: 13.11.2016 - 23:10
VilaWeb

La reforma ortogràfica aprovada recentment per la Secció Filològica de l’Institut d’Estudis Catalans (IEC) ha tingut un gran ressò en els mitjans de comunicació i ha originat bastant polèmica. En particular, la reforma és especialment coneguda per l’eliminació d’un centenar llarg d’accents diacrítics que s’usaven per a desfer algunes ambigüitats de mots que, essent diferents i tot, s’escriurien igual si no fóra per l’accent gràfic: per exemple, el substantiu ‘son’ (ganes de dormir) i el verb ‘són’ (de ‘ser’).

Dic algunes ambigüitats, perquè la llista dels mots amb accent diacrític no era exhaustiva. Hi ha moltes coincidències que havien passat desapercebudes en l’ortografia anterior. Distingia ‘vénen’ (del verb ‘vindre’) i ‘venen’ (del verb ‘vendre’), però no distingia, per exemple, ‘podem’, ‘podeu’ i ‘poden’ (‘poder’ o ‘podar’?), ‘volem’, ‘voleu’ i ‘volen’ (‘voler’ o ‘volar’?), ‘creuen’ (‘creure’ o ‘creuar’?) o ‘dic’ (verb ‘dir’ o construcció per a contindre les aigües?), ni molts altres casos. D’aquestes coincidències se’n diu homògrafs, mot d’origen grec, que vol dir ‘que s’escriuen igual’.

Jo no entraré directament en assumptes estrictament lingüístics. Vull donar la meua opinió com a tecnòleg que es dedica, sobretot, a la traducció automàtica.

I des d’aquesta posició dic que la reforma ortogràfica del IEC s’ha fet sense tindre’n en compte l’impacte sobre les tecnologies informàtiques que s’usen per a tractar textos: la traducció automàtica, els correctors ortogràfics i gramaticals, etc.

Un component important de les tecnologies de la llengua és el que se sol dir anàlisi morfològica dels mots. Segur que hi ha qui se’n recorda de l’escola. L’anàlisi morfològica serveix, per exemple, per a determinar que el lema –la forma de diccionari o forma de citació– de ‘caminàvem’ és ‘caminar’, verb, i que el lema de ‘camions’ és ‘camió’, nom. Els analitzadors morfològics simplifiquen els diccionaris: ja no han de guardar totes les formes, sinó només els lemes.

Però aproximadament un de cada tres mots d’un text en català és un homògraf: té més d’una anàlisi, i s’ha de triar la correcta. Hem de saber si ‘duc’ és un nom que indica un cert nivell de nobilitat, o un verb que té el mateix significat que ‘porte’. La tria se sol fer usant informació sobre els mots veïns, usant regles lingüístiques o models estatístics.

Ara, per exemple, IEC ha decidit d’eliminar l’accent diacrític de ‘dóna’ (del verb ‘donar’). Ara, ‘dona’ pot ser un nom i dues formes del verb ‘donar’. I ‘venen’ una forma de ‘vindre’. I ‘fora’ i ‘soc’, formes del verb ‘ser’. Com a resultat, s’han de canviar els analitzadors morfològics per a admetre noves anàlisis que no preveien. I a més s’ha de canviar el mòdul que s’encarrega dels mots homògrafs, perquè ara n’hi ha més. Recordeu que en una aplicació informàtica, una anàlisi incorrecta pot donar problemes riu avall.

I ja en dóna. L’oració ‘Soc jo qui dona les gràcies’ (nova manera d’escriure ‘Sóc jo qui dóna les gràcies’) acaba traduïda automàticament a l’espanyol com ‘Zoco yo quien mujer las gracias’ (Apertium) o com ‘Tronco yo quien mujer las gracias’ (Lucy Software). Potser convé dir que tots dos exemples són de tecnologies fetes a casa nostra.

Però l’impacte és encara més gran. Ja no escrivim en paper: tots i totes usem processadors de textos. Quant tardaran els correctors ortogràfics i gramaticals de LibreOffice, OpenOffice.org, o Microsoft Word a actualitzar-se? I els correctors en línia com ara LanguageTool que s’ofereixen a través de webs com Softcatalà? Quant tardaran a adaptar-se els correctors que usem dins dels nostres programes de correu electrònic i els nostres navegadors? N’hi haurà prou amb els quatre anys de moratòria que el IEC anuncia que donarà perquè la reforma entre en vigor? Els quatre anys contrasten amb els quinze anys que va donar, per exemple, la reforma ortogràfica del portuguès del 1990.

Però encara que es deixen quatre anys, qui ho haurà de pagar, tot açò? Recordeu que una bona part del suport per al català d’aquestes aplicacions s’havia pagat amb diners públics. Ara cal pagar la gent que ha de fer i comprovar les modificacions: una inversió addicional inesperada, sobrevinguda, producte d’una decisió que no ha tingut en compte res de tot això. Una decisió amb uns costos que no es compensen amb els presumptes beneficis de la reforma (‘simplificar i aclarir al màxim el codi ortogràfic’), beneficis, que, probablement, es notaran només a la llarga. Hi ha encara moltíssimes altres parts de l’ortografia catalana que són bastant complexes perquè es note tant una reforma menor com aquesta.

Penseu que l’impacte arriba encara més lluny. Per exemple, tota la Viquipèdia en català s’ha de corregir. I, ara, què en fem de totes les aplicacions i estudis lingüístics empírics que es basaven en la Viquipèdia o altres grans corpus de text en català que ja no són ortogràficament correctes?

Supose que esteu d’acord amb mi que per a ser viva, una llengua ha de ser viva en el món digital, en el món d’internet. Per a això, necessita totes les tecnologies lingüístiques que he anat esmentant adés. El IEC no les ha considerades, en aquesta decisió. Ja es veu que la majoria dels cervells del IEC viuen en un passat pre-digital –on viuen de fet molts filòlegs i moltes filòlogues–, i açò s’ha notat. De fet, en la llista de la Secció Filològica, no hi ha cap ‘lingüista computacional’ com a tal, i només hi reconec una persona que sé que sap de tecnologies de la llengua, però no sé si ha participat en les decisions. Açò potser explica el que ha passat.

Segur que hi ha qui pensa que no cal que hi haja persones expertes en tecnologia lingüística dins la Secció Filològica del IEC. Jo, en canvi, crec que li aniria molt bé de tindre’n. En tot cas, les persones que ens dediquem a les tecnologies lingüístiques en el nostre país –tant en el món acadèmic com en el món associatiu i industrial– som ben conegudes i accessibles, i se’ns podria haver consultat abans de prendre la decisió. Pel que jo sé, només hi ha hagut contactes en algun cas (Softcatalà), però quan la reforma ja era un fet i només per a preguntar ‘amb qui calia parlar’ per a aplicar-la.

I penseu que les tecnologies lingüístiques no en som l’únic sector afectat! També l’educació, la premsa escrita… qualsevol sector que use el català per escrit haurà d’invertir-hi temps i diners. Qui ho pagarà, tot això? Creurà que valia la pena?

Amb tot, s’ha de dir que el text de la reforma té un paràgraf que expressa una certa cautela quan ‘admet l’ús discrecional de l’accent diacrític’ que ‘s’amplia a casos com ara enunciats aïllats […] en què és possible més d’una interpretació del mot homògraf i pot produir-se, doncs, una ambigüitat indesitjada que no resol el context comunicatiu’. A mi em vénen ganes de fer com VilaWeb: resistir-m’hi i estirar l”ús discrecional’ a tots els meus textos.

Abans d’acabar, us dic que em sorprèn el silenci oficial d’institucions que també hi entenen, com ara l’Acadèmia Valenciana de la Llengua (AVL), l’Institut Interuniversitari de Filologia Valenciana, els departaments de Filologia Catalana de les Universitats, etc. En particular, al País Valencià, la reforma ortogràfica complica un paisatge de contradiccions normatives (IEC, AVL, Generalitat Valenciana, serveis lingüístics de les universitats).

Per tot això que acabe d’explicar, considere que la reforma ortogràfica del IEC no és pròpia de l’era digital i és del tot lamentable que s’haja dut a terme així, sense consultar sectors importants afectats. Espere que el ple del IEC (on hi ha persones expertes de moltes altres àrees) la deixe en suspens fins que no hagen fet les consultes públiques oportunes.

Recomanem

La premsa lliure no la paga el govern. La paguem els lectors.

Fes-te de VilaWeb, fem-nos lliures.

Fer-me'n subscriptor
des de 75€ l'any