viernes, 4 de enero de 2013

AnƔlisis de correspondencias: un ejemplo electoral

El anĆ”lisis de correspondencias (correspondence analysis, CA) es una tĆ©cnica de representaciĆ³n de datos multivariantes en dimensiĆ³n reducida.

Cuando los objetos o individuos se describen mediante un conjunto de variables, existen varios mĆ©todos para representar los datos en dimensiĆ³n reducida, normalmente en dos o tres dimensiones. Los mĆ©todos varĆ­an en funciĆ³n del tipo de variables consideradas: numĆ©ricas, categĆ³ricas o ambas.

El anĆ”lisis de correspondencias es apropiado para describir los datos de dos variables categĆ³ricas con las que se obtiene una tabla de contingencia o tabla de frecuencias. El objetivo es representar las filas (o las columnas) como puntos de un espacio cartesiano de dimensiĆ³n reducida (normalmente 2) y cuya distancia entre ellos se ajuste a la proximidad de sus perfiles. Dos objetos (filas de la tabla) con perfiles o porcentajes muy similares deben representarse con puntos muy cercanos y al revĆ©s, dos objetos con perfiles muy distintos se representan con puntos muy distantes. Al mismo tiempo, tambiĆ©n se pueden representar las variables (columnas de la tabla) como puntos del mismo espacio y la proximidad de los puntos que representan los objetos a un punto que representa una variable indica la importancia relativa de esa variable en el perfil del objeto.

Un ejemplo de tabla de contingencia son los resultados electorales (nĆŗmero absoluto de votos) de las candidaturas que han obtenido representaciĆ³n en las Ćŗltimas elecciones del 2012 al Parlament de Catalunya. Para reducir el nĆŗmero de puntos vamos a considerar los resultados para los 73 barrios de Barcelona y las 7 candidaturas con representaciĆ³n. Estos datos se pueden ver en el apartado 1.4 del documento ele31.pdf en www.bcn.cat. En esta situaciĆ³n los objetos son los barrios y las variables las candidaturas.

En este caso el CA no depende de ninguna encuesta, ya que los datos son reales. AdemĆ”s no precisa de ningĆŗn cocinado y su interpretaciĆ³n es simple: la proximidad de los puntos muestra la similitud de perfiles.

Una vez cargados los datos, el cĆ³digo R para obtener el grĆ”fico que se ve al principio de esta entrada es muy simple.

load("ele31.RData")
library(FactoMineR)
myca <- CA(ele31[ ,5:12], ncp=2)

El resultado es muy bueno ya que el primer eje explica un 65,54% de la variabilidad total (inercia total), mientras que el segundo explica un 29,98%. En total un 95,52%. La representaciĆ³n tiene una calidad excelente.

Con el paquete ca se puede hacer un anƔlisis mƔs profundo con un CA asimƩtrico y otros grƔficos.

AnƔlisis electoral

Sin ser exhaustivo, el mapa de puntos tiene una interpretaciĆ³n muy clara.

En primer lugar, el eje principal u horizontal viene marcado por la contraposiciĆ³n de dos partidos CiU i PSC que son como polos opuestos (no es un anĆ”lisis polĆ­tico). El segundo eje viene definido por la contraposiciĆ³n de PP i Cs a los partidos mĆ”s de izquierdas y catalanistas como ICV-EUiA, ERC y CUP. A destacar tambiĆ©n la proximidad de ERC y CUP y la situaciĆ³n intermedia de la propuesta ecosocialista y a favor del derecho a decidir de ICV-EUiA que la sitĆŗa entre el PSC y esos dos grupos. TambiĆ©n es evidente la proximidad de Cs al PP.

En cuanto a los barrios, con 73 nombres es un poco difĆ­cil analizarlos todos, pero los que se sitĆŗan en los extremos son los mĆ”s visibles.

SarriĆ , los dos Sant Gervasi, les Tres Torres y Pedralbes son el paraĆ­so de la derecha.

Algunos barrios son territorio PSC como BarĆ³ de Viver, Vallbona, Torre BarĆ³,…

A ICV-EUiA le gustarĆ­a que en la Clota hubiera mĆ”s electores, pero sĆ³lo hay 296.

La Vila de GrĆ cia es muy especial, pero tambiĆ©n el Poblenou y el Barri GĆ²tic donde triunfan los partidos de izquierda.

Sin embargo, para ser mĆ”s tradicional en el anĆ”lisis creo que se puede hacer una rotaciĆ³n de los ejes. Que quede claro que una rotaciĆ³n no modifica las distancias entre los puntos. En concreto he hecho una rotaciĆ³n de 120 grados en direcciĆ³n contraria a las agujas del reloj. Con esta rotaciĆ³n el eje horizontal se identifica con el clĆ”sico eje derecha-izquierda, mientras que el segundo eje se puede interpretar como el eje que contrapone las propuestas nacionalistas o independentistas de Catalunya a los unionistas (federalistas o no).

Los barrios mƔs destacados son:

  • el Raval (1, muy rojo)
  • el Barri GĆ²tic (2, otro rojo)
  • Pedralbes (21, en el mapa estĆ” muy, pero que muy a la derecha)
  • Vallvidrera, el Tibidabo i les Planes (22, el mĆ”s nacionalista)
  • les Tres Torres (24, el segundo por la derecha)
  • la Vila de GrĆ cia (31, el mĆ”s indepe)
  • la Clota (42, el mĆ”s rojo)
  • Roquetas (50)
  • Torre BarĆ³ (54)
  • Ciutat Meridiana (55, el mĆ”s unionista)
  • la Trinitat Vella (57)
  • el Poblenou (68, el barrio de Joan Herrera)

Para que nos entendamos, en el Poblenou hay mucho voto de ICV-EUiA, ERC y CUP. TambiƩn hay muchos votos a CiU, pero se equilibran con los votos de PSC, PP y Cs. Esta es la mejor forma de leer el mapa.

Si ademĆ”s se considera la abstenciĆ³n como un partido mĆ”s, entonces Ć©ste queda situado entre los partidos de izquierda, justo entre PSC e ICV-EUiA. Otro dato para la reflexiĆ³n de los que no votan.

BibliografĆ­a

Greenacre MJ (2007). Correspondence Analysis in Practice. Chapman & Hall/CRC, Boca Raton, second edition.

2 comentarios: