La doble petjada del big data

VilaWeb
Foto: Robin Worrall
Xavier Duran
30.11.2021 - 05:15

El 5 de febrer del 2021 els periodistes d’investigació Charlie Warzel i Stuart A. Thompson van publicar en la web de The New York Times un article on explicaven que algú els havia proporcionat dades de milers de seguidors de Donald Trump que el 6 de gener havien protagonitzat una invasió violenta del Capitoli a Washington (Warzel i Thompson, 2021). I això, tot i que els números de mòbil no porten associada una identitat, havia permès traçar l’origen de moltes persones fins al lloc d’on venien i fins i tot esbrinar els seus noms, adreces i comptes de xarxes socials.

Dos anys abans, als dos autors ja els havien arribat dades de localitzacions de més de dotze milions de ciutadans nord-americans, cosa que permetia rastrejar-ne els moviments. Però en el cas del Capitoli, cada localització anava associada a un codi ID –o mobile advertising identifier–, que és únic per a cada usuari i està lligat al seu mòbil intel·ligent o a la seva tauleta. Només calia encreuar aquest ID amb altres bases de dades per obtenir una immensa quantitat d’informació sobre cada persona.

És possible que molta gent consideri útil i fins i tot necessària la possibilitat d’utilitzar un ID per perseguir el delicte. Però, tal com expliquen els dos periodistes, aquest ID el fan servir nombroses empreses, institucions i entitats, inclosos bancs i fons d’inversió, que poden obtenir, així, una gran informació sobre qualsevol ciutadà.

La nostra activitat diària ho fa possible. Gairebé tothom navega per Internet i fa cerques i una gran majoria de ciutadans realitzen, en algun moment, una compra a distància. Però, encara que no es faci res d’això, tots estem a nombroses bases de dades, des de padrons municipals a entitats esportives o culturals, passant per serveis mèdics, entitats d’estalvi i arxius fiscals.

I molts, a més, tenim activitat a les xarxes socials. I això dona moltíssima informació. Segons explicava Mat Travizano al setembre de 2018 a Entrepreneur (Travizano, 2018), Facebook tenia en aquell moment dades personals per omplir, de mitjana, 400.000 documents de Word amb cada usuari. I Google en podia omplir vora tres milions per a cada internauta.

Com s’ha arribat a aquesta situació, en què aquestes empreses tenen tanta informació? I quin impacte té en la nostra privacitat i seguretat?

Les dades, model de negoci 

Per comprendre-ho hem d’anar a finals dels anys noranta del segle XX. Havien sorgit multitud d’empreses tecnològiques, les anomenades puntcom. Les expectatives de creixement eren altes i, probablement, també massa optimistes. I el capital risc s’hi va abocar. Això va fer pujar de forma meteòrica, a borsa, unes empreses que, en la major part, no tenien ni tan sols un model de negoci. Guanyaven quota de mercat, però amb molts serveis gratuïts i, per tant, no generaven beneficis. Cap a l’any 2000, la situació de la majoria d’aquestes empreses era molt delicada, per no dir desesperada, i tenien molts més deutes i promeses de futur que no pas realitats.

I va ser aleshores quan empreses com Google van veure quin potencial tenien per monetitzar els seus serveis: les dades. Tot i que els mòbils intel·ligents no estaven gaire estesos i la capacitat dels ordinadors i dels algoritmes per processar grans quantitats de dades eren limitades, l’ús de la informació com a matèria primera va funcionar. Així, Google va ingressar 19 milions de dòlars l’any 2000, però el 2001 ja eren 86 milions; el 2002, 440 milions; el 2003, 1.500 milions, i el 2004 va ingressar 3.200 milions de dòlars. Un augment del 3.590 % en quatre anys. El 2020 va ingressar 146.920 milions només en publicitat.

Tenir dades és tan valuós que moltes empreses ja ho situen com un objectiu, al marge de si fabriquen neveres o cotxes o si lloguen vehicles o apartaments. El novembre del 2018, el CEO de Ford va anunciar l’objectiu de monetitzar i vendre les dades que recollia dels cent milions de persones que conduïen els seus vehicles (Sadowski, 2020, p. 31). A part dels seus hàbits i rutes, potser podria esbrinar si conduïen de forma prou prudent o per carreteres prou segures, cosa que interessa molt a companyies d’assegurances.

Sobre això ja n’hem parlat a Mètode en una altra ocasió, però les possibilitats de saber coses de nosaltres creixen de forma desmesurada. A més, Google, Facebook i Amazon, que es reparteixen la major part del mercat publicitari digital mundial –es calcula que el 2018 entre Google i Facebook controlaven el 84 % del mercat mundial exceptuant la Xina–, saben qui som, perquè per utilitzar els seus serveis ens hi hem de d’inscriure i donar com a mínim el nostre correu electrònic.

Amb dades del 2018, Amazon va tenir 6.720 milions de dòlars d’ingressos en publicitat. Sembla poc si ho comparem amb els 38.370 milions de Facebook i els 83.680 de Google. Però pensem que, en teoria, la major part dels seus ingressos han de ser per vendre productes, no per anuncis. Però la publicitat li dona més marge que les vendes.

Llig ací l’article complet publicat en la Revista Mètode.

Recomanem

La premsa lliure no la paga el govern. La paguem els lectors.

Fes-te de VilaWeb, fem-nos lliures.

Fer-me'n subscriptor
des de 75€ l'any