1.3 Combinacions simples o matemàtiques complexes?

Un cop obtingudes les dades d’allò que ens interessa mesurar, el següent pas és el d’arribar a un número que resumeixi el resultat. Seguint l’exemple de la temperatura, el resultat de la medició del termòmetre ha de ser en una escala coneguda i comparable. En ciències naturals no hi ha massa problemes i les mesures se solen definir sempre en base a constants universals. Però en el cas d’obtenir dades en escales sense una constant o una referència clara, què podem fer?

Les solucions passen per fer servir escales que siguin almenys matemàticament convenients. Per exemple, considerar que el zero és el valor més baix, i l’1 o el 100 el valor màxim. O considerar el zero com el valor mitjà i deixar un marge de números negatius i números positius. O estandarditzar el resultat a base de dividir per la desviació estàndard. En tot cas, s’acabi en una o altra escala, el procediment sempre compta. Per exemple, en el cas de la democràcia: si acordem que la democràcia té tres dimensions (diguem-ne llibertat política, selecció del legislatiu en base a eleccions i participació mínima), com combinem les tres?

En la majoria dels casos la solució per la qual opten les institucions que s’han encarregat de generar aquestes dades és la de calcular mitjanes simples, o agregar (sumar) les diferents variables per generar un indicador global. És al procediment més habitual quan se sent a parlar de “indicador de globalització”, “índex de corrupció”, “nivell de democràcia”, etc. En realitat, però, aquesta solució basada en la combinació simple de variables sol assumir una sèrie de coses que no sempre són justificades o argumentades.

És aquí on entren els models estadístics, que permeten combinar les dades de diferents variables per crear indicadors d’una manera més sistemàtica i acurada. Mètodes com l’anàlisi factorial, els models d’ítem-resposta o l’anàlisi de components principals ajuden els investigadors a destriar millor quines són les ponderacions de cada variable en el conjunt de l’indicador final.

Un exemple d’indicador basat en l’agregació de diferents variables seria aquest: \[ \text{Indicador} = \text{Variable 1} + \text{Variable 2} + \text{Variable 3}\]

En canvi, un exemple d’indicador basat en models estadístics seria semblant a: \[ \text{Indicador} = P_{1} * \text{Variable 1} + P_{2} * \text{Variable 2} + P_{3} * \text{Variable 3}\] on \(P_{n}\) són els pesos o ponderacions corresponents a cada variable. Aquests pesos en calculen dins el mateix model en base a les mateixes dades. D’aquesta manera, per exemple, si la Variable 1 no discrimina bé entre aquells casos amb alt o baix valor de l’indicador, se li atorga un pes menor.

En resum, que no hi ha cap motiu científic per generar indicadors a través de combinacions simples de variables, més enllà de la conveniència i el fet que assignar pesos a vegades es pugui considerar un tema polític. Per exemple, l’índex de desenvolupament humà creat pel PNUD de les Nacions Unides ha optat per considerar que el deselvolupament es divideix en tres parts iguals: economia, educació i salut. Si es feien combinacions diferents i s’atorgaven pesos diferents, la posició dels Estats Units es veia compromesa i queia per sota de països com Cuba, de manera que es va optar per deixar l’índex com una mera agrupació, assumint que cada dimensió aporta el mateix, sense considerar què hi diuen les dades.

Per tant, sempre que sigui possible és preferible que facis servir indicadors que tinguin un model estadístic robust al darrera, i que no siguin una mera agrupació de valors creats amb una mitjana o una suma.