A banda de les mesures socioeconòmiques generals que podem trobar als World Developemnt Indicators, dins mateix del Banc Mundial un dels seus economistes, Branko Milanovic, manté una acurada base de dades sobre desigualtat, juntament amb una referència bibliogràfica imprescindible per entendre el procés de desenvolupament econòmic i social en els últims cent cinquanta anys, i de retruc les relacions internacionals. Es tracta de Milanovic (2010Milanovic, Branko. 2010. The Haves and the Have-Nots: A Brief and Idiosyncratic History of Global Inequality. Basic books.).
El primer capítol explica què entenem per desigualtat, fa un repàs a les teories per les quals tradicionalment hem entès que tenia un efecte sobre el comportament econòmic, i —especialment rellevant per a fonts d’informació—, presenta breument com es mesura la desigualtat.
El coeficient de Gini és la mesura estàndard de la desigualtat econòmica dins d’un grup social. El més habitual és considerar els estats com els grups socials de referència, però una de les virtuts del coeficient de Gini és que és aplicable a qualsevol grup social format per més de dos unitats (ja siguin persones o llars, vegeu el capítol). Ho calculem sumant la diferència d’ingressos (a vegades també es fa servir renda) entre totes los combinacions possibles d’unitats d’un grup social. En un grup social de 3 unitats (A, B i C), la operació és igual a \((A-B) + (A-C) + (B-C)\). A aquesta suma de diferències d’ingressos li dividim el nombre d’unitats (tres en l’exemple anterior) i la mitjana dels ingressos del grup. Aquesta operació aritmètica ens dóna un valor que està en un rang teòric entre 0 i 1. Com que ja hem comentat que és una mesura de desigualtat, el zero es correspon a la menor desigualtat, o quan tothom en el grup té exactament el mateix nivell d’ingressos (fixa’t que les diferències d’ingressos serien totes zero, i la seva suma també seria zero, de manera que al numerador només hi quedaria zero, que dividit per qualsevol cosa dóna zero). A l’altre extrem, hi ha l’1, que es correspon a casos de grups amb extrema desigualtat, quan un únic individu té tots els ingressos i la resta no en tenen gens. Com s’indica a la lectura, el rang efectivament observable del coeficient de Gini, va de 0.25 a 0.60, o més habitualment expressat en una escola de zero a cent: de 25 a 60, que és el que coneixem com a índex de Gini.
El segon capítol es centra fonamentalment a explicar la desigualtat en termes comparats entre països i al llarg del temps. Milanovic explica quines estratègies es fan servir per comparar ingressos en diferents moments del temps, introduint el concepte de paritat de poder adquisitiu (PPP, per les sigles en anglès). També explica per què és millor que ens refiem de les dades d’ingressos obtingudes a partir de les enquestes, que no pas de les dades obtingudes a partir de registres burocràtics (declaracions d’impostos, bàsicament), tot i que les primeres tenen un recorregut temporal més breu (des de meitats del segle XX per a economies avançades, i des de finals del XX per economies emergents, i encara molt problemàtiques per economies no desenvolupades).
El nivell de renda dels països presentat en aquest segon capítol no deixa de ser el que hem introduït a la secció anterior (el PIB), tot i que en no en valor absolut (que és una mesura de la mida d’una economia), sinó en valor relatiu, que esdevé llavors una mesura de riquesa d’una societat.
Per tant, a l’hora de voler obtenir dades de riquesa o benestar material, i sobretot vols fer comparacions en el temps, has de fer servir sèries temporals en del PIB per càpita en PPP5 Recorda que necessites la llibreria WDI
:
gdp.pc.ppp <- WDI(indicator = "NY.GDP.PCAP.PP.KD",
start = 1990, end = 2015)
str(gdp.pc.ppp)
## 'data.frame': 6864 obs. of 4 variables:
## $ iso2c : chr "1A" "1A" "1A" "1A" ...
## $ country : chr "Arab World" "Arab World" "Arab World" "Arab World" ...
## $ NY.GDP.PCAP.PP.KD: num 15343 15199 15174 15056 14445 ...
## $ year : num 2015 2014 2013 2012 2011 ...
Per calcular com ha anat divergint el PIB per càpita en els estats pels quals hi ha dades fem servir la desviació estàndard, que és una mesura de diferència respecte a la mitjana en un grup d’observacions6 La desviació estàndard s’interpreta com el valor esperable que té la diferència de dues observacions agafades a l’atzar en un grup de valors. Com a promig, quan divergiran dues observacions?. El primer que fem és agafar l’objecte gdp.pc.ppp
que conté les quatre variables que hem obtingut abans (codi ISO en dos caràcters, nom del país, valor de la variable, i any) i enviar-lo a una canonada (%>%
) per agrupar-lo per anys, de tal manera la la última línia, que fa un resum de la variable que ens interessa, ens farà el resum anualment. En aquest cas, el resum és l’aplicació de la variable sd()
, que caldula la desviació estàndard (standard deviation), i que obvia els valors perduts (na.rm = TRUE
).
gdp.pc.de <- gdp.pc.ppp %>%
group_by(year) %>%
summarize(Desviació = sd(NY.GDP.PCAP.PP.KD, na.rm = TRUE))
ggplot()
com anteriorment, i especificar els valors que aniran a cada eix, així com el tipus de figura que volem (línies, per marcar una evolució temporal), i fixar un valor de referència per a l’eix vertical.
Figure 2.3: Evolució temporal de la desigualtat de renda entre països, mesurada per la desviació estàndard anual de la renda per càpita als països del món. Font: World Development Indicators. Fixa’t que la crisi financera del 2008 en realitat va significar un equiparament entre els països, un fre a la creixend desigualtat entre estats.
ggplot(gdp.pc.de, aes(x = year, y = Desviació)) +
geom_line() +
expand_limits(y = 0) +
xlab("Any")
Per obtenir les dades dels índexs de Gini, preparades per Branko Milanovic, hem de fer servir les seves matrius, que estan en format Stata
(extensió .dta
), però que a través del paquet foreign
es poden llegir fàcilment en R
:
# previous read
library(foreign)
gini <- read.dta("https://wfs.gc.cuny.edu/njohnson/www/BrankoData/allginis_2016.dta")
library(foreign)
gini <- read.dta("https://www.gc.cuny.edu/getmedia/92e1b3ac-eae5-4787-aa20-5306913eca90/allginis_2016")
Giniall
) l’obtenim amb un histograma, on hi marquem els rangs teòrics.
Figure 2.4: Distribució dels índexs de Gini estandarditzats (1980-2015)
ggplot(gini, aes(x = Giniall)) +
geom_histogram() +
xlab("Coeficients de Gini") +
expand_limits(x = c(0, 100))
L’evolució de la mitjana dels índexs de Gini es pot obtenir agrupant les observacions anuals, i fent-ne la mitjana7 Fixa’t, però, que aquesta és la mitjana dels índexs de Gini de cada país, de manera que els països tenen el mateix pes, sense ponderar pel seu nivell de població. Per tant, no es pot llegir com una evolució de la desigualtat al món, sinó només com una evolució de la desigualtat entre Estats..
gini.any <- gini %>%
group_by(year) %>%
summarize(Mitjana = mean(Giniall, na.rm = TRUE))
ggplot(gini.any, aes(x = year, y = Mitjana)) +
geom_line() +
xlab("Any") + ylab("Mitjana dels índexs de Gini") +
expand_limits(y = c(0, 100))