Els núvols de paraules

  • El consultor informàtic Joan Jofra ens proposa cada setmana solucions dels problemes informàtics

VilaWeb
VilaWeb
Joan Jofra
10.01.2015 - 06:00

La premsa lliure no la paga el govern, la paguen els lectors


Fes-te de VilaWeb, fem-nos lliures

Avui parlaré dels núvols. Però no del núvol on es desen les dades i de què tothom parla, sinó dels núvols de paraules. En plena era de les imatges i la informació no podem deixar de banda l’ús de les paraules, però tot i així podem organitzar-les de manera que es comportin com a imatges sense deixar de banda el vessant comunicatiu d’aquestes. És el que es coneix com a núvol de paraules.

Amb l’arribada del 2015 us anuncio que he posat en marxa un bloc, Pensalla.cat, on trobareu la recopilació dels articles que he fet per a l’Internauta, com també els àudios i vídeos. El nom és el meu tribut al gran mestre de la comunicació i creador del programa, Jordi Vendrell.

I vaig pensar que una manera de veure com parlava de cada tema, quines paraules clau feia servir i com resumia tots els meus articles era fer un estudi de les paraules utilitzades.

Perquè un núvol de paraules és això: un resum estatístic i una representació visual de les paraules que ens descriu un contingut, en diferents mides de lletres que ens mostren la freqüència relativa i que ens poden donar enllaços per aconseguir més informació.

Com ho podem posar al nostre bloc?

A WordPress, i a tots els blocs, hi ha el concepte ‘núvol d’etiquetes’, que fa referència només a les etiquetes que manualment hem volgut posar al nostre article i al conjunt dels articles del nostre bloc. A cada article el creador assigna etiquetes destacades i trobareu molts widgets que us les mostraran en forma de núvol. També podeu fer-ho amb les categories de WordPress.

Però com puc fer-ho amb les paraules? Si no us voleu complicar la vida, l’opció més senzilla és Wordle que com la majoria de recomanacions que us faig és gratuït i molt senzill de fer servir.

Aneu a l’opció ‘Create’ i enganxeu el test que vulgueu analitzar o bé poseu-hi la URL de la vostra pàgina. Wordle analitza el llenguatge en què és escrit l’article i elimina de l’estudi els articles, preposicions, conjuncions, nombres i paraules que no hi entren.

A partir del primer núvol creat podeu configurar-lo a les vostres necessitats o fer clic al botó ‘randomize’ per anar veient disposicions. Si ho voleu configurar manualment al vostre gust, podeu fer que consideri els nombres, podeu fer que consideri totes les paraules en minúscula o totes en majúscula, podeu canviar el tipus de lletra (el programa en fa servir un d’aleatori), el tipus de disposició (rectangular o arrodonida), com voleu que mostri les paraules (horitzontals, verticals, barreja, etc.) i, finalment, de quin color voleu el gràfic.

Una vegada el gràfic sigui del vostre gust, només heu d’agafar la imatge i incorporar-la al vostre bloc: segurament la solució més simple serà fer una captura de la pantalla i retallar-la perquè surti al bloc.

Hi ha uns altres sistemes més o menys automàtics, però cap amb la capacitat i senzillesa d’aquest. La simple feina de treure’n articles i paraules no significatives ja val la pena, però requereix Java i això fa que no funcioni en telèfons i pissarretes. Mireu l’apartat d’apps específiques per a pissarretes. Així que si voleu fer proves amb uns altres programes…

Word it out: enganxeu-hi un text i en veureu el resultat, sense esborrar articles i paraules poc significatives.

ImageChef: té gràfics de fons diferents, com per exemple el trèvol de la sort, però certament limitat a texts curts i tampoc permet de treure les paraules poc significatives.

Tagul: requereix registre o fer servir el compte de Twitter i Facebook, però molt configurable a còpia de feina. Podem decidir quines paraules no volem que surtin al gràfic a partir de la llista que ens proporciona de les que es fan servir, té molts perfils i molt divertits (podeu fer un núvol amb la forma d’un llangardaix) i et permet que les paraules tinguin enllaços externs. Molt potent si hi dediqueu hores.

Tagxedo: també ens permet d’elegir quines paraules no volem que formin part del núvol, també a canvi de feina, però és força configurable i ens ofereix enllaços per a cada paraula.

Apps per a pissarretes

L’app gratuïta, si més no d’entrada, és Wordsalad, encara que si voleu que no us surti el ‘watermark’, força emprenyador, haureu de passar per caixa. Té l’opció de reconeixement del català i, fàcilment, treu articles, preposicions, etc. sense feina per part nostra. Paga la pena. Té versió per a iOS i Android.

Més barata és Word Collage, a la qual falta tractament del català i l’únic perfil és un cercle.

TagCloud que també li falta tractament del català, però té una gran galeria d’imatges per fer núvols.

Anem per nota

Mai no hem dit que explicaríem coses senzilles, així que anem per nota…

Els núvols són una representació estatística, doncs anem a buscar quin és el programa estatístic més usat en el món acadèmic: R, l’estàndard per a aquestes feines que podem fer servir per a ‘data mining’, anàlisi predictiva i, exactament, visualització de dades com els núvols.

Per fer-ho més complicat, R és un programa que funciona per a ordres de consola, no amb interfície gràfica, però ja hem dit que no ens arronsàvem… Així que:

1. Anem a R-project.org i descarreguem el programa (n’hi ha versions per a Windows, Mac, GNU/Linux, Unix).

2. Instal·leu també RStudio, una interfície d’usuari que us simplificarà la vida.

3. Creeu un text per a analitzar i guardeu-lo en un directori. Per exemple, temp.

4. instal·leu els paquets que us faltin, segur que necessitareu ‘tm’ i ‘wordcloud’ (text mining package i wordcloud package) i els que requereixin aquests paquets.

Sota la pestanya ‘Packages’ de RStudio, mireu si són instal·lats i, si no, ‘Tools > Install Packages’ i aneu instal·lant.

5. Si heu arribat fins aquí, seguiu el tutorial del bloc Georeferenced i podreu configurar fins a l’infinit el vostre núvol particular.

Idees per a fer

Els núvols no serveixen només per als nostres blocs. Proveu-los per:

-Si busqueu feina i teniu un currículum, feu-lo passar per un núvol de paraules per veure si el currículum representa fidelment què voleu expressar.

-Si treballeu l’anglès, la millor eina per a anàlisi de paraules és la de VisualThesaurus, perquè no sols analitza i organitza per rellevància les paraules, sinó que les posa en context, et dóna significats per a cada paraula, et diu les definicions de cada paraula, els verbs, exemples d’ús… Una eina imprescindible per als qui tracten l’idioma anglès.

En l’àmbit educatiu, penseu com els mestres poden aprofitar una eina estatística de paraules per a millorar l’escriptura dels alumnes, per exemple, per fer veure la quantitat de vegades que una mateixa paraula es repeteix en un text, en lloc de sinònims o descripcions que diguin el mateix. Feu la prova amb ‘bé’ o ‘malament’: mireu quantes vegades surten i quantes vegades es podrien substituir…

McLuhan deia: ‘El medi és el missatge.’ Avui hem descobert la manera de convertir un grapat de paraules presentades com ‘dibuixos’ en infinitat de missatges relacionats entre si i que aporten el màxim d’informació possible.

Recomanem

La premsa lliure no la paga el govern. La paguem els lectors.

Fes-te de VilaWeb, fem-nos lliures.

Fer-me'n subscriptor
des de 75€ l'any