El mensaje sobre el tercer informe de gobierno: una nube de palabras

Las 50 palabras más usadas por el presidente Enrique Peña Nieto en su mensaje con motivo de la entrega del tercer informe de gobierno, son las incluidas en la nube de palabras o word cloud que se muestra más adelante.

La palabra más usada en el mensaje del presidente es “México”. Después se emplea “mexicanos”, “país” y “nacional”. En un tercer nivel se utiliza “desarrollo”, “reforma” y “hoy”. En un cuarto nivel se emplea “administración”, “gobierno”, “familias”, “años”, “2012” y “2014”. Finalmente, en el quinto nivel y subsecuentes se utilizan diversas palabras como “república”, “programa”, “personas”, “economía” y “educación”, entre otras.

Resulta interesante observar que en el quinto nivel de importancia se emplean palabras como “justicia”, “pobreza” e “inseguridad”, pero no pareciera que se use el término “violencia” de manera reiterada.

Por el lado de las reformas estructurales, aunque se emplea el término “sector”, éste no se complementa de manera frecuente con “eléctrico” o “electricidad”, “petrolero” o “energético”, como quizá pudo esperarse. Pero sí destaca el uso continuo de “educación” y “educativa”.

Por otro lado, el político, destaca el uso menos frecuente de “política”, “república”, “acuerdo”, e “instituciones”. Pero no pareció usarse de manera frecuente “elecciones”, “electoral” o “campaña”.

Sin duda, los términos que indican temporalidad resultan de interés, particularmente “2012”, “2014”y “2015”. También destaca la continua referencia a “hoy”, “ahora” y puesto que se trata del tercer informe de seis, también se emplea reiteradamente la palabra “mitad”. (Para un análisis de palabras que incluya los dos mensajes de años previos, ver el post de José Merino aquí)

Por último, es importante recordar que este tipo de word cloud únicamente revela la frecuencia con aparecen palabras en un texto o discurso, sin que ello conlleve en sí mismo una explicación o interpretación específica. Ésa queda a juicio de los lectores.

epn3wordcloud

Para replicar este ejercicio, se sugiere copiar el texto del mensaje de esta dirección y pegarlo en un archivo de texto (con terminación txt). En el programa R (que puede obtenerse de manera gratuita aquí) deben abrirse las librerías que a continuación se indican y seguir estos pasos:

##librerías requeridas en R

library(tm)

library(RTextTools)

library(topicmodels)

library(“wordcloud”)

library(“SnowballC”)

library(RColorBrewer)

##Comandos para cargar el discurso en R. Nótese que debe especificarse la ##dirección, y en el folder sólo debe existir el archivo txt a analizar

epn3 <- Corpus (DirSource(“blog/epn”))

##Comando para verificar que se cargó el discurso llamado epn3

inspect(epn3)

##Comandos para quitar espacios en blanco, remover puntuación, pasar texto a ##letras minúsculas y eliminar preposiciones y conjunciones

epn3<- tm_map(epn3, stripWhitespace)

epn3<- tm_map(epn3, removePunctuation)

epn3<- tm_map(epn3, tolower)

epn3<- tm_map(epn3, removeWords, stopwords(“spanish”))

##El comando stemDocument sirve para encontrar palabras con raíces comunes, ##pero no se usó en este word cloud

## epn3<- tm_map(epn3, stemDocument)

##palabras que adicionalmente se consideró conveniente remover

epn3<- tm_map(epn3, removeWords, “así”)

epn3<- tm_map(epn3, removeWords, “cada”)

epn3<- tm_map(epn3, removeWords, “además”)

epn3<- tm_map(epn3, removeWords, “mismo”)

epn3<- tm_map(epn3, removeWords, “partir”)

epn3<- tm_map(epn3, removeWords, “año”)

epn3<- tm_map(epn3, removeWords, “vamos”)

epn3<- tm_map(epn3, removeWords, “millones”)

epn3<- tm_map(epn3, removeWords, “mil”)

epn3<- tm_map(epn3, removeWords, “mayor”)

##Comando final para graficar el word cloud con las 50 palabras más usadas

wordcloud(epn3, scale=c(5,0.5), max.words=50, random.order=FALSE, rot.per=0.35, use.r.layout=FALSE, colors=brewer.pal(8, “Dark2”))

About Alejandro Diaz Dominguez

Professor, School of Government at Tecnológico de Monterrey. PhD in Political Science at Vanderbilt University. [religion and politics, R, surveys, electoral management bodies] Twitter: @alejdiazd https://orcid.org/0000-0002-3856-5686 View all posts by Alejandro Diaz Dominguez

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

%d bloggers like this: