Encuestas en la elección del dirigente panista

 

El próximo 18 de mayo la militancia panista elegirá a su presidente nacional entre Ernesto Cordero y Gustavo Madero. Como en toda elección, las encuestas aparecen generando expectativas y este caso no ha sido la excepción. Se analizarán las tendencias actuales, hasta antes del debate, empleando los datos públicamente disponibles.

Los datos provienen de nueve encuestas levantadas por cinco casas encuestadoras entre el 10 de marzo y el 22 de abril de este año y se muestran en la tabla 1, donde además se ofrece el tamaño de muestra, que va de 400 a 1,000 entrevistas, así como el método de recolección de la información, sea entrevista en vivienda o por teléfono.

En todos los casos, excepto uno, se constató que el universo fueran los militantes panistas (excepto la encuesta de ARCOP del 14 abril, pues no lo indica, sólo se sabe que fue levantada en vivienda, como lo reportó Milenio). Tampoco se agregaron los datos de una encuesta de Mendoza Blanco y Asociados difundida por la campaña de Madero y fechada el primero de abril, con 47% para Madero y 44% para Cordero, sin precisar si los nueve puntos restantes correspondían a no respuestas, como uno generalmente puede suponer. Sin embargo, en el sitio de Mendoza no se cita esa encuesta ni esa fecha, y por ende no fue posible obtener el número de entrevistas, dato relevante para calcular intervalos, como se explicará más adelante.

Tampoco se incluyó en este “post” un dato de Gabinete con 24% para Cordero y 12% para Madero del 23 de enero, pues no se halló referencia en su sitio, pero aquí la gráfica donde se observan dichos datos (http://www.milenio.com/politica/Madero_y_Cordero-encuestas-Marko_Cortes-aventaja_Madero-aventaja_Cordero_MILIMA20140414_0364_30.jpg). Finalmente tampoco se incluyó el dato de Consulta de septiembre de 2013 sobre opinión favorable (11 para Madero y 13 para Cordero) entre simpatizantes panistas, dato obtenido de una muestra en vivienda de 1000 entrevistas, debido a que en ese entonces no existía elección, ni se preguntó por intención de voto.

datacenpan

Tabla 1

La elección parece más competida conforme se acerca el día de las votaciones, como se muestra en la gráfica 1, donde simplemente se ofrecen los datos disponibles empleando las preferencias netas (que no incluyen a los “no sabe/no contestó”), datos que tanto candidatos como diferentes casas han publicitado y que se mostraron en la tabla 1, más el dato de Mendoza fechado el primero de abril (reasignando proporcionalmente a los indecisos).

Muchos de estos datos también se pueden hallar en la página de Varela y Asociados (http://www.varelayasociados.com.mx/wp-content/uploads/2014/04/Panabril3_201404.jpg) ahorrándose el lector la molestia de compilarlos de múltiples fuentes (como le ocurrió al autor del blog -ya ven, por no leer con atención los banners, pero al menos se puede decir que siempre es bueno cotejar información).

pan1

Gráfica 1

De esta primera gráfica se puede concluir que la serie de encuestas de Mendoza son las que dan mejores números a Madero (52, 52 y 55 puntos para 23 de marzo, primero y 13 de abril, respectivamente). El resto de las casas otorgan a Cordero cuando menos el 53%. También debe decirse que el ejercicio de Parametría de teléfono y vivienda fue efectuado casi a la par, aunque dan al mismo candidato como puntero. Se optó por no excluir esta encuesta telefónica, pues existen otras tres en la serie (una de Covarrubias y dos de Varela que estiman al mismo puntero).

Dado que se cuenta con el número de casos en las nueve encuestas reportadas en la tabla 1, se estimó la tendencia para cada candidato de manera muy básica, es decir, ponderando por la raíz cuadrada del número de entrevistas, de modo tal que se pudiera obtener algún intervalo, dado que en alrededor de cuarenta días, las preferencias por Cordero registran un mínimo de 45 y un máximo de 69, con un promedio de 54 puntos; mientras que las preferencias por Madero van de 31 a 55, con un promedio de 46 puntos.

Debe precisarse que aunque se utilice esta ponderación, en realidad no se están considerando a las encuestas como muy diferentes entre sí, pues no se estiman house effects por ejemplo. Como se aprecia en la gráfica 2, los resultados para Cordero muestran una tendencia que los primeros días fue cercana al 60%, pero una semana más tarde apenas rebasaba el 50%.

pan2eca

Gráfica 2

En el caso de Madero, como lo muestra la gráfica 3, esos primeros días de mediciones públicas eran de 40 puntos, pero más tarde la tendencia lo situó muy cerca del 50%. En suma, la elección parece más competida conforme pasa el tiempo.

pan3gm

Gráfica 3

La mera inspección de las gráficas 2 y 3 revela que los intervalos calculados se tocan, es decir, que la distancia entre candidatos, dados los tamaños de muestra, no permite distinguir un claro ganador, que ocurre cuando dichos intervalos no se enciman.

El resultado de sobreponer ambas gráficas ponderando por tamaño de muestra se ofrece en la gráfica 4, donde se observan las tendencias y los intervalos respectivos. Al calcular la tendencia empleando todos los puntos de encuesta, se puede decir que “en promedio”, Ernesto Cordero va apenas por encima de los 50 puntos y que Gustavo Madero va apenas por debajo de dicho umbral. Sin embargo, al encimarse los intervalos, esto no es necesariamente definitivo, aunque parece ser la tendencia.

pan4

Gráfica 4

Quizá lo que se requiere es un mejor método para el cálculo de los intervalos, como un trendline usando un Kalman filter, aunque son pocos datos para esta elección panista. Un ejemplo de Kalman se ofrece en este post de Diego Valle-Jones para 2012 (http://blog.diegovalle.net/2012/07/poll-of-polls-including-quick-count.html) donde se observa que los intervalos tienen un rango de 5 o 6 puntos. Otra opción es contar con encuestas adicionales, las que seguramente se publicarán una vez que se celebre el debate entre los candidatos a dirigir al PAN.

Finalmente, en la última gráfica de este “post”, la número 5, se agrega la encuesta de Mendoza del primero de abril y se estiman los intervalos sin el número de casos, simplemente con un polinomio de regresiones locales, que es mucho más eficiente cuando se tienen numerosas observaciones, que no es el caso de nuestra base de datos.

pan5all

Gráfica 5

Como se observará al agregar dicha encuesta, las tendencias se emparejan en la tercera semana de marzo y a mediados de abril, aunque al final de la serie, esto es, antes del debate, Cordero “en promedio” sí rebasa los 50 puntos, aunque debe reiterarse que los intervalos definitivamente se enciman. Por ahora, lo más que se puede decir con las limitaciones en datos y modelo, es que el asunto parece competido. Veremos qué datos arrojan las futuras mediciones.

 

About Alejandro Diaz Dominguez

Professor, School of Government at Tecnológico de Monterrey. PhD in Political Science at Vanderbilt University. [religion and politics, R, surveys, electoral management bodies] Twitter: @alejdiazd https://orcid.org/0000-0002-3856-5686 View all posts by Alejandro Diaz Dominguez

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

%d bloggers like this: