Encuestas de evaluación al Jefe de Gobierno del DF (actualizado 2013-2014)

Pareciera que la volatilidad en las encuestas en las elecciones presidenciales mexicanas de 2012 pudiera repetirse en la Ciudad de México, según se observó en la disparidad de las mediciones sobre la aprobación al Jefe de Gobierno durante 2013 y 2014. Pero el presente texto dará cuenta que la disparidad, la cual sí existe, afortunadamente no impide conocer algunas tendencias en los niveles de aprobación y desaprobación del Jefe de Gobierno del Distrito Federal.

En un “post” anterior (https://alejandrodiazd.wordpress.com/2014/02/07/encuestas-durante-2013-la-evaluacion-al-jefe-de-gobierno-del-df/) se explicaban a detalle las posibles razones de las disparidades. Una muestra “ampliada” desde enero de 2013 hasta abril de 2014 se ofrece en esta actualización, donde ya se cuenta con 28 mediciones. Aunque existen variaciones importantes entre casas encuestadoras, ello se debe a varias razones, como ya se explicó con detalle en el “post” citado previamente.

Sin embargo, en el caso del DF, los datos para 2013 y 2014 respecto de la evaluación del Jefe de Gobierno sí revelan, para mal (del gobierno capitalino) y para bien (de la estadística), un par de tendencias que pudieran ser más o menos claras, considerando un intervalo en el que se puedan ubicar todas las mediciones, de manera que tengamos alguna “certeza” sobre el conjunto de encuestas. Debe precisarse que en estadística tenemos “certezas”, pero como les solía decir en son de broma y a la vez en serio a mis alumnos de metodología, “tenemos certezas, sólo que nuestras ‘certezas’ generalmente son al 95 por ciento”.

Aprovechando el paquete estadístico R (gratuito y disponible http://cran.r-project.org/ con algunos comandos básicos ya resumidos y explicados en dos hojitas por Olivia Lau http://www.olivialau.org/software/Rtips.pdf) y las funciones del paquete de moda para hacer gráficas, el famoso ggplot (su manual original aquí http://cran.r-project.org/web/packages/ggplot2/index.html) pueden crearse gráficas simples pero informativas. Una forma muy didáctica y sencilla de crear tales gráficas se explica en este post de Andrew Landgraf para R-bloggers (http://www.r-bloggers.com/quick-post-about-getting-and-plotting-polls-in-r/). Para este post lo único que hice fue “crear” un par de gráficas donde se apreciaran los niveles de aprobación y desaprobación al Jefe de Gobierno del DF, con un área gris alrededor de la línea de tendencia, pues dicha área gris nos indicará en qué parte del intervalo se ubican las mediciones.

La gráfica 1 muestra los niveles de aprobación y aunque algunos puntos se observan fuera del área gris, sí pareciera existir una tendencia hacia la baja en la aprobación al gobierno del doctor Mancera. Escribo la palabra “pareciera”, porque como ya se explicó, se está asumiendo en la gráfica que la casi treintena de encuestas analizadas es muy similar en sus características, lo cual no es necesariamente así.

Gráfica 1

jgdfapp1314

Respecto a la desaprobación, la gráfica 2 muestra que en efecto, sí pareciera existir una tendencia al alza en este rubro. Nuevamente se observan puntos fuera del área gris pero la línea de tendencia va acercándose al 50 por ciento. En conclusión, aunque las encuestas contengan innegables diferencias, sí se vislumbra una creciente desaprobación durante 2013 y 2014.

Gráfica 2

jgdfdis1314

Con todo, debe decirse que este no es más que un ejercicio muy sencillo, susceptible de ser mejorado si se incorporan en la estimación los house effects, los tamaños de muestra o cualquier otra consideración adicional.

Finalmente, se ofrece el código en R para “crear” las dos gráficas mostradas. Primero debe abrirse R y enseguida instalarse y llamarse a las librerías: XML, reshape y ggplot2.

library(XML)

library(reshape)

library(ggplot2); theme_set(theme_bw())

Después se llama al archivo que contiene los datos descritos en las gráficas. Personalmente no importo archivos de Excel a R, sino que los guardo como csv (archivos separados por comas). En este caso el archivo se llama “jgdf2013.csv”, pero R debe conocer en qué folder se ubica este archivo. Para ello se emplea el comando “getwd()” que arroja la ubicación. Para cambiar la ubicación se pueden buscar los comandos en la parte superior de la consola de R, esto es “Archivo” y “Cambiar dir…” y con el ratón se puede seleccionar el folder correcto.

getwd()

[1] “C:/Users/Documents”

En este caso, ya se tenía el folder correcto. Entonces se procede a llamar al archivo:

mm<-read.csv(“jgdf2013.csv”)

A la base de datos se le llama con otro nombre, el nombre de un objeto en R. En este caso le llamé “mm” (para quienes tienen twitter recordarán un hashtag  #mm). Ahora, para cotejar la integridad del archivo se emplea el comando “names” que nos indica los nombres de las variables de la base de datos:

names(mm)

[1] “date”          “Pollster”     “Approve”      “Disapprove”

Y después empleamos el comando “summary” para conocer los descriptivos de las variables:

summary(mm)

Finalmente, con el comando “ggplot” indicamos que en la base de datos (identificada como el objeto mm), usando el comando aesthetics (aes) queremos graficar la variable “date” (que va de enero de 2013 a abril de 2014 y representa el mes de levantamiento) con la variable “Approve” (que incluye las mediciones de aprobación al Jefe de Gobierno). Después le decimos que nos calcule la línea de tendencia en automático con el “geom_smooth” (no le indicamos en este ejercicio simple un método de estimación específico, entonces al tener menos de mil casos, por default calcula un polinomio por el método “loess”), y al no ponerle “se=FALSE” nos da un área gris por default en 0.95, es decir, un intervalo de confianza al 95 por ciento. Después le pedimos que identifique con una línea punteada dónde está el 50 por ciento de aprobación (lo hacemos por ahí donde dice “yintercept=50”) y finalmente le ponemos título y etiquetas.

ggplot(mm,aes(date,Approve, color=Pollster))

+geom_point(alpha=.5)+geom_smooth(aes(group=1))

+geom_hline(aes(yintercept=50),lty=2,size=1)

+labs(title=”Mayor of Mexico City Approval Ratings Jan of 2013- Apr of 2014″, x=”28 Surveys”,y=”%”)

+ylim(0,100)+geom_text(aes(label = Approve), size = 6)

 

El mismo procedimiento se realiza para graficar la desaprobación, pero utilizando desde luego la variable “Disapprove” y ajustando el título en consecuencia:

ggplot(mm,aes(date,Disapprove, color=Pollster))

+geom_point(alpha=.5)+geom_smooth(aes(group=1))

+geom_hline(aes(yintercept=50),lty=2,size=1)

+labs(title=”Mayor of Mexico City Disapproval Ratings Jan of 2013- Apr of 2014″,x=”28 Surveys”,y=”%”)

+ylim(0,100)+ geom_text(aes(label = Disapprove), size = 6)

 

Espero que no solo resulte útil la muy simple introducción a ggplot en R, sino que se pueda valorar su utilidad dentro de la disparidad existente en las mediciones de encuesta, porque esta construcción específica permite conocer algunas tendencias en los niveles de aprobación y desaprobación al gobierno de la ciudad durante 2013 y 2014, a pesar de las innegables disparidades entre mediciones.

About Alejandro Diaz Dominguez

Professor, School of Government at Tecnológico de Monterrey. PhD in Political Science at Vanderbilt University. [religion and politics, R, surveys, electoral management bodies] Twitter: @alejdiazd https://orcid.org/0000-0002-3856-5686 View all posts by Alejandro Diaz Dominguez

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

%d bloggers like this: