El Banc Mundial manté una base de dades d’indicadors de governança, els Worldwide Governance Indicators, que tot i el poc abast temporal (1996-2006), representen un esforç considerable per sintetitzar dades de diferents fonts.
L’aproximació en aquest cas no es basa en fonamnets teòrics sòlids dels indicadors, sinó que la idea és combinar dades de moltes fonts diferents de tal manera que puguem classificar els països anualment segons sis dimensions institucionals i de govern:
Els indicadors han rebut força crítiques, que tot i ser en part contestades pels responsables, representen en part un llast almenys des del punt de vista acadèmic. No obstant això, es tracta d’una base de dades d’un gran abast i que incorpora idees que malgrat ser molt esteses, no sempre s’han pogut mesurar fàcilment (com per exemple l’efectivitat dels governs).
Hi ha una crítica fonamental i una limitació. D’una banda, la crítica és per la part de l’enllaç entre les dades i la teoria. Els indicadors resultants són un compendi de variables agafades de moltes fonts diferents i que no sempre està clar que tinguin clara relació amb el concepte que pretenen mesurar (validesa interna). La limitació és deguda al fet que els índexs estan generats de tal manera que estan centrats en zero anualment. D’aquesta manera, tots els països estan més o menys lluny del a mitjana centrada a zero. Però no hi ha manera de dir si d’any en any un país ha millorat en termes absoluts, ja que precisament per estar centrada la mesura en el zero, sempre serà relativa a la resta de països. Per tant, es tracta d’un índex que només es pot interpretar d’any en any, i no pas com una sèrie temporal de valors connectats.
La introducció de dades no és automàtica, sinó que o bé cal que descarreguis les dades des d’un full de càlcul i el netegis manualment, o bé pots accedir a través d’una API del Banc Mundial i et generis un arxiu amb els països, les variables i els anys que desitgis.
Manualment és tediós, però per a fer-ho en un únic indicador i per a un únic any és possible d’aquesta manera:
library(openxlsx)
url <- "http://info.worldbank.org/governance/wgi/pdf/wgidataset.xlsx"
indicador <- "Government effectiveness"
indicador.llibre <- "GovernmentEffectiveness"
any <- 2016
any.columna <- 105 # "DA" Estimador, any 2016
wgi <- read.xlsx(url, sheet = indicador.llibre,
startRow = 15, cols = c(1, 2, any.columna),
na.strings = "#N/A")
str(wgi)
## 'data.frame': 214 obs. of 3 variables:
## $ Country/Territory: chr "Aruba" "Andorra" "Afghanistan" "Angola" ...
## $ WBCode : chr "ABW" "ADO" "AFG" "AGO" ...
## $ Estimate : num 0.896 1.86 -1.222 -1.039 1.329 ...
Els deu estats amb governs menys efectius són els següents:
wgi %>%
arrange(Estimate) %>%
slice(1:10)
## Country/Territory WBCode Estimate
## 1 South Sudan SSD -2.2599
## 2 Somalia SOM -2.1804
## 3 Haiti HTI -2.0583
## 4 Libya LBY -1.8915
## 5 Syrian Arab Republic SYR -1.8250
## 6 Yemen, Rep. YEM -1.8195
## 7 Central African Republic CAF -1.7681
## 8 Eritrea ERI -1.6850
## 9 Korea, Dem. Rep. PRK -1.6475
## 10 Guinea-Bissau GNB -1.6354
La primera línia pren l’objecte creat anteriorment i l’envia a una canonada, que serà utilitzada per les funcions que vénen després. La segona línia ha arranjat (ordenat, arrange()
) les dades per ordre de la variable Estimate
, i la tercera línia fa un tall de les deu primeres observacions (slice()
).
Els deu estats amb governs més efectius són els següents (igual que abans, però amb valor descendent aplicant la funció desc()
):
wgi %>%
arrange(desc(Estimate)) %>%
slice(1:10)
## Country/Territory WBCode Estimate
## 1 Singapore SGP 2.2086
## 2 Switzerland CHE 2.0256
## 3 Denmark DNK 1.8876
## 4 Norway NOR 1.8829
## 5 Hong Kong SAR, China HKG 1.8609
## 6 Andorra ADO 1.8602
## 7 New Zealand NZL 1.8576
## 8 Finland FIN 1.8485
## 9 Netherlands NLD 1.8413
## 10 Japan JPN 1.8324
La distribució dels valors la podem obtenir amb un histograma10 Fixa’t que la variable està centrada en el zero, per definició, com ja hem comentat., i afegir-hi una línia vertical al lloc del país candidat que vulguem.
Figure 3.8: Distribució dels valors de l’eficàcia del govern, amb una línia vertical assenyalant un país candidat, en aquest cas Alemanya.
candidat <- "Germany"
ggplot(wgi, aes(x = Estimate)) +
geom_histogram() +
geom_vline(xintercept = wgi$Estimate[wgi$`Country/Territory` == candidat])
En aquest cas, i degut a què la variable de l’estat conté un caràcter estrany, hem hagut de referir-nos a la variable afegint-hi un accent obert al principi i al final.