Encuestas durante 2013: la evaluación al Jefe de Gobierno del DF

Pareciera que la volatilidad en las encuestas en las elecciones presidenciales mexicanas de 2012 pudiera repetirse en la Ciudad de México, según se observó en la disparidad de las mediciones sobre la aprobación al Jefe de Gobierno durante 2013. Como se recordará, la tendencia general de casi 50 puntos para el entonces candidato del PRI en las elecciones presidenciales no se terminó por cumplir. La distancia entre dicha tendencia general y las mediciones de cada casa encuestadora fue calculada por Diego Valle-Jones en junio de 2012 en esta gráfica http://2.bp.blogspot.com/-ehK0-oI9tGY/T-t2sC0eQAI/AAAAAAAAFYM/-9T2U3ga9CY/s1600/surface247.png.  El presente texto dará cuenta que la disparidad, la cual sí existe, afortunadamente no impide conocer algunas tendencias en los niveles de aprobación y desaprobación del Jefe de Gobierno del Distrito Federal.

Por un lado, pareciera que algunas encuestas revelan que las cosas marchan más o menos bien en cuanto a la evaluación del Jefe de Gobierno, pero por otro lado, algunas mediciones reflejan que los niveles de aprobación han estado disminuyendo (dicha disparidad se observa en este reporte de casi 15 encuestas elaborado por Varela y Asociados http://www.varelayasociados.com.mx/popularidad-del-jefe-de-gobierno-del-distrito-federal/).

Una muestra “ampliada” de mediciones desde enero hasta noviembre de 2013 se ofrece en la tabla 1, donde se cuenta con 18 mediciones. Como se aprecia en dicha tabla sí existen variaciones importantes entre casas encuestadoras, debido a varias razones, como sus propios sesgos metodológicos (los llamados “house effects”, que se calculan asumiendo que todas las encuestas juntas están en lo correcto y su promedio es el dato real. Con esa base se obtienen los puntos que cada casa encuestadora sobre o subestima a un determinado candidato o partido. Un ejemplo elaborado por Simon Jackman utilizando el caso de los EUA en 2012 aquí  http://www.huffingtonpost.com/simon-jackman/house-effects-by-back-by-_b_2007907.html).

Otra razón para que los resultados varíen es el “fraseo” de la pregunta, también llamado “question wording”, ya que desempeño, acuerdo y aprobación pudieran no significar lo mismo para los encuestados. Una comparación de los fraseos utilizados en 2013 para las mediciones en el DF revela que el question wording empleado por Berumen y Consulta es el mismo (http://consulta.mx/web/index.php/estudios-e-investigaciones/evaluacion-de-gobierno/270-distrito-federal-evaluacion-de-gobierno-miguel-angel-mancera) y que el usado por Votia y Parametría son casi iguales, excepto que Votia añade “en términos generales” (Votia aquí http://www.votia.mx/?page_id=105  y Parametría acá http://www.parametria.com.mx/carta_parametrica.php?cp=4587). El Universal por su parte, introduce al final de la pregunta “cómo Miguel Ángel Mancera desempeña el puesto de jefe de gobierno” (el question wording está aquí pero en la pregunta 2  http://www.eluniversal.com.mx/ciudad-metropoli/2013/encuesta-mejora-mancera-968404.html#aumenta261113). Finalmente, Reforma agrega al final de la pregunta “la forma como está haciendo su trabajo” (http://gruporeforma-blogs.com/encuestas/wp-content/uploads/2013/12/Escena2.png).

Las diferencias se explican también por tamaño de muestra, por la forma de construir la muestra (unos por estratos, otros por conglomerados y otros con diseños adicionales) y por fechas de levantamiento, es decir, si se incluyeron fines de semana o no, si algún evento muy importante alteró las percepciones o si el levantamiento ocurrió previo a ese evento. En síntesis, existen diversas razones por las cuales las encuestas pueden variar. Sin embargo, a cualquier ciudadano, sea o no especialista en encuestas no dejan de llamarle la atención las disparidades que a veces se observan, como bien se aprecia en la ya citada tabla 1.

Tabla 1

Image

Sin embargo, en el caso del DF, los datos para 2013 respecto de la evaluación del Jefe de Gobierno sí revelan, para mal (del gobierno capitalino) y para bien (de la estadística), un par de tendencias que pudieran ser más o menos claras, considerando un intervalo en el que se puedan ubicar todas las mediciones, de manera que tengamos alguna “certeza” sobre el conjunto de encuestas. Debe precisarse que en estadística tenemos “certezas”, pero como les solía decir en son de broma y a la vez en serio a mis alumnos de metodología, “tenemos certezas, sólo que nuestras ‘certezas’ generalmente son al 95 por ciento”.

Aprovechando el paquete estadístico R (gratuito y disponible http://cran.r-project.org/ con algunos comandos básicos ya resumidos y explicados en dos hojitas por Olivia Lau http://www.olivialau.org/software/Rtips.pdf) y las funciones del paquete de moda para hacer gráficas, el famoso ggplot (su manual original aquí http://cran.r-project.org/web/packages/ggplot2/index.html) pueden crearse gráficas simples pero informativas. Una forma muy didáctica y sencilla de crear tales gráficas se explica en este post de Andrew Landgraf para R-bloggers (http://www.r-bloggers.com/quick-post-about-getting-and-plotting-polls-in-r/). Para este post lo único que hice fue “crear” un par de gráficas donde se apreciaran los niveles de aprobación y desaprobación al Jefe de Gobierno del DF, con un área gris alrededor de la línea de tendencia, pues dicha área gris nos indicará en qué parte del intervalo se ubican las mediciones.

La gráfica 1 muestra los niveles de aprobación y aunque algunos puntos se observan fuera del área gris, sí pareciera existir una tendencia hacia la baja en la aprobación al gobierno del doctor Mancera. Escribo la palabra “pareciera”, porque como ya se explicó, se está asumiendo en la gráfica que la casi veintena de encuestas analizadas es muy similar en sus características, lo cual no es así.

Gráfica 1

Image

Respecto a la desaprobación, la gráfica 2 muestra que en efecto, sí pareciera existir una tendencia al alza en este rubro. Nuevamente se observan puntos fuera del área gris pero la línea de tendencia va acercándose a los 50 puntos. Destaca que el máximo del área gris al principio de la gráfica no excede los 25 puntos. Pero al final, el mínimo de la referida área gris apenas se sitúa por debajo de los 40, es decir, dichos puntos no se tocan, esto es, el punto máximo en desaprobación que fue estimado para enero (25 puntos) es estadísticamente diferente del punto mínimo de desaprobación que fue estimado para noviembre (40 puntos). En conclusión, aunque las encuestas contengan innegables diferencias, sí se vislumbra una creciente desaprobación durante 2013.

Gráfica 2

Image

Este fenómeno de distinción estadística en las áreas grises no se observa en el caso de la aprobación, aunque en la gráfica 1 sí se aprecia que la línea de tendencia va a la baja. Con todo, debe decirse que este no es más que un ejercicio muy sencillo, susceptible de ser mejorado si se incorporan en la estimación los house effects, los tamaños de muestra o cualquier otra consideración adicional.

Finalmente, se ofrece el código en R para “crear” las dos gráficas mostradas. Primero debe abrirse R y enseguida instalarse y llamarse a las librerías: XML, reshape y ggplot2.

library(XML)

library(reshape)

library(ggplot2); theme_set(theme_bw())

Después se llama al archivo que contiene los datos contenidos en la tabla 1. Personalmente no importo archivos de Excel a R, sino que los guardo como csv (archivos separados por comas). En este caso el archivo se llama “jgdf2013.csv”, pero R debe conocer en qué folder se ubica este archivo. Para ello se emplea el comando “getwd()” que arroja la ubicación. Para cambiar la ubicación se pueden buscar los comandos en la parte superior de la consola de R, esto es “Archivo” y “Cambiar dir…” y con el ratón se puede seleccionar el folder correcto.

getwd()

[1] “C:/Users/Documents”

En este caso, ya se tenía el folder correcto. Entonces se procede a llamar al archivo:

mm<-read.csv(“jgdf2013.csv”)

A la base de datos se le llama con otro nombre, el nombre de un objeto en R. En este caso le llamé “mm” (para quienes tienen twitter recordarán un hashtag  #mm). Ahora, para cotejar la integridad del archivo se emplea el comando “names” que nos indica los nombres de las variables de la base de datos:

names(mm)

[1] “Obs”          “Pollster”     “Approve”      “Disapprove”   “Month”      

[6] “Diff.App.Dis”

Y después empleamos el comando “summary” para conocer los descriptivos de las variables:

summary(mm)

Finalmente, con el comando “ggplot” indicamos que en la base de datos (identificada como el objeto mm), usando el comando aesthetics (aes) queremos graficar la variable “Obs” (que va del uno al 18 y que representa a cada casa encuestadora según mes de levantamiento durante 2013) con la variable “Approve” (que incluye las mediciones de aprobación al Jefe de Gobierno). Después le decimos que nos calcule la línea de tendencia en automático con el “geom_smooth” (no le indicamos en este ejercicio simple un método de estimación específico, entonces al tener menos de mil casos, por default calcula un polinomio por el método “loess”), y al no ponerle “se=FALSE” nos da un área gris por default en 0.95, es decir, un intervalo de confianza al 95 por ciento. Después le pedimos que identifique con una línea punteada dónde está el 50 por ciento de aprobación (lo hacemos por ahí donde dice “yintercept=50”) y finalmente le ponemos título y etiquetas.

ggplot(mm,aes(Obs,Approve))+geom_point(alpha=.5)+geom_smooth(aes(group=1))

+geom_hline(aes(yintercept=50),lty=2,size=1)

+labs(title=”Mayor of Mexico City Approval Ratings 2013″,x=”Pollster”,y=NULL)

El mismo procedimiento se realiza para graficar la desaprobación, pero utilizando desde luego la variable “Disapprove” y ajustando el título en consecuencia:

ggplot(mm,aes(Obs,Disapprove))+geom_point(alpha=.5)+geom_smooth(aes(group=1))

+geom_hline(aes(yintercept=50),lty=2,size=1)

+labs(title=”Mayor of Mexico City Disapproval Ratings 2013″,x=”Pollster”,y=NULL)

Espero que no solo resulte útil la muy simple introducción a ggplot en R, sino que se pueda valorar su utilidad dentro de la disparidad existente en las mediciones de encuesta, porque esta construcción específica permite conocer algunas tendencias en los niveles de aprobación y desaprobación al gobierno de la ciudad durante 2013, a pesar de las innegables disparidades entre mediciones.

About Alejandro Diaz Dominguez

Professor, School of Government at Tecnológico de Monterrey. PhD in Political Science at Vanderbilt University. [religion and politics, R, surveys, electoral management bodies] Twitter: @alejdiazd https://orcid.org/0000-0002-3856-5686 View all posts by Alejandro Diaz Dominguez

One response to “Encuestas durante 2013: la evaluación al Jefe de Gobierno del DF

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

%d bloggers like this: