Tag Archives: datos

Perfil de personas que han fallecido por covid19 en México

Durante la pandemia, uno de los análisis descriptivos más difíciles es el relativo a las defunciones. Quizá resulta necesario conocer, de acuerdo con las cifras oficiales, cuál era su perfil demográfico, si se les practicó una prueba, sus condiciones de salud y el tipo de hospital donde recibieron atención.

La forma en que se extrajo la estadística descriptiva que se muestra a continuación fue explicada en una entrada anterior (https://alejandrodiazd.wordpress.com/2020/05/03/descripcion-de-datos-de-manera-grafica-usando-r/), donde se detalló un posible uso de la librería summarytools en el paquete estadístico R, con base en los datos abiertos del gobierno federal, cuya información diaria e histórica del 12 de abril a la fecha también se encuentra referida en dicha entrada (https://www.gob.mx/salud/documentos/datos-abiertos-152127).

La primera tabla muestra que dos tercios de quienes fallecieron por covid19, de acuerdo con los datos oficiales provienen de las USMER del método centinela, pero un tercio no. Ese tercio de pacientes provenían de unidades no USMER.

También se observa que dos tercios dieron positivo en la prueba, un cinco por ciento aún esperaba sus resultados y 29 por ciento tuvo resultados negativos. Al menos eso es lo que arroja la base de datos abiertos del 8 de mayo de 2020.

Al explorar más sobre este dato, se encontró que de las personas fallecidas que dieron negativo en la prueba, 70 por ciento reportaron neumonía. Finalmente, el 35 por ciento de las personas fallecidas eran mujeres y el promedio de edad en las 4,803 defunciones fue 59 años.

Tabla 1. Origen, pruebas y demográficos

undefined

Respecto a las condiciones de salud, se halló que 92 por ciento de las personas fallecidas fueron hospitalizadas, pero el 8 por ciento restante no, es decir, fueron pacientes de carácter ambulatorio. De acuerdo con la base de datos, el 0.2 por ciento (ocho mujeres) fallecieron estando embarazadas.

En relación con las condiciones de salud, destaca ampliamente que el 73 por ciento tenía neumonía. Asimismo, el 43 por ciento tenía hipertensión, el 40 por ciento padecía diabetes, el 26 por ciento obesidad, tabaquismo el 10 por ciento, padecimientos renales el 9 por ciento, epoc el 8 por ciento, así como 8 por ciento también quienes presentaban padecimientos cardiovasculares, enfermedades inmunosupresoras el 6 y asma el 3 por ciento.

Finalmente, sólo el 16 por ciento estuvo en terapia intensiva e intubado el 21 por cierto. Esto significa que sólo para una de cada cinco personas que fallecieron por covid, de acuerdo con los datos abiertos oficiales, se reportó que tuviera respirador.

Tabla 2. Condiciones de embarazo, hospitalización y saludundefined

Por último, tres tipos de hospitales públicos concentraron al 94 por ciento de los fallecimientos: IMSS, Sector Salud e ISSSTE. El 44 por ciento de los decesos se reportó en el IMSS, el 43 por ciento en hospitales del sector salud y 7 por ciento en el ISSSTE. El resto se distribuyen entre hospitales privados (dos por ciento), estatales (dos por ciento) y de Pemex (uno por ciento), entre otros. Ello sugiere que 9 de cada diez decesos han ocurrido en IMSS, Sector Salud e ISSSTE.

Tabla 3. Tipo de hospital

undefined

Finalmente, puede sintetizarse que entre las personas fallecidas:

  • 35 por ciento eran mujeres.
  • 59 años fue la edad promedio.
  • 92 por ciento fue hospitalizado.
  • 70 por ciento de quienes dieron negativo en la prueba reportaban neumonía.
  • Sólo 1 de cada 6 estuvo en cuidados intensivos.
  • Sólo 1 de cada 5 tuvo respirador.
  • 94 por ciento se concentró en IMSS, Sector Salud e ISSSTE.

Este trabajo de descripción requerirá su contraparte en cada una de las entidades federativas, así como reflexiones posteriores respecto a la mejor forma de analizar la información que distribuye el gobierno federal. Desde luego que lo descriptivo es sólo el primer paso en cualquier análisis, pero siempre nos puede ofrecer una idea sobre dónde estamos, antes de emprender una exploración de mayores proporciones en un tema tan complejo.


Descripción de datos de manera gráfica usando R

En esta breve nota exploraremos la funcionalidades de la librería summarytools, del paquete estadístico R, el cual es de acceso libre y se puede obtener aquí.

Para obtener una tabla de descripción de datos con número total de casos, valores mínimos, máximos y promedio, frecuencias, datos válidos y perdidos, así como la gráfica de barras correspondiente existen diversas opciones en R. Una de ellas es la que ofrece la librería summarytools, la cual se puede descargar con el comando install.packages, como lo veremos más adelante. El manual detallado de summarytools se halla en este sitio y los ejemplos se encuentran explicados en este lugar.

Usaremos la base de datos abiertos del covid19 del gobierno federal en México, con un recopilación del 12 de abril de 2020 en adelante (histórico) y el del día, los cuales debemos desempaquetar, pues vienen en formato zip y ya fuera de la compresión, se presentan en terminación csv. Para este ejemplo usaremos los datos del 24 de abril. Ya que abrimos R, instalamos el paquete:

### Not run

install.packages("summarytools")       

library("summarytools") 

base <- read.csv("200424COVID19MEXICO.csv")
dim(base)
names(base)

### Usando la librería car, podemos recodificar:

library(car)

### Este es sólo un ejemplo que deriva de los descriptores y catálogos…

### …de las bases de datos abiertos de la Secretaría de Salud.

base$Mujer<-(base$SEXO)
base$Mujer<-recode(base$Mujer,"1=1;2=0")

base$Hospitalizado<-(base$TIPO_PACIENTE)
base$Hospitalizado<-recode(base$Hospitalizado,"1=0;2=1")

base$uci<-(base$UCI)
base$uci<-recode(base$uci,"1=1;2=0;97=0;99=0")

### Y así sucesivamente… Ahora, una vez lista la base,

### se procede a su descripción.

### Se genera la tabla de estadísticas de tendencia central:

descr(base)

### Pero si preferimos las variables en renglones, hay que invertir…

descr(base, transpose=TRUE)

### Si se quiere agregar gráficas para cada variable, entonces usamos:

dfSummary(base)

### El comando dfSummary detecta si se trata de

### variables continuas o discretas.

### Si se trabaja con R base como yo, entonces…

### … lo mejor es guardar el resultado de df Summary en un objeto…

### … al cual le llamé va:

va <- dfSummary(base)

### Esto es porque el método para ver el resultado sólo funciona en…

### … RStudio, Markdown o en formato html.

### Con el comando view podemos guardar nuestro objeto en el folder…

### … de nuestra preferencia en formato html, para uso posterior:

view(va, file = "~/covid19/24abr20.html")

### y el resultado será un archivo html.

### End

Así podemos analizar nuestros datos con un solo golpe de vista, iniciando con lo más sencillo, que es conocer los descriptivos de cada una de las variables, para luego proceder a realizar cualquier tipo de análisis. El ejemplo de una parte de la visualización se muestra al final de esta nota.

sumtools1


Curvas de casos positivos reportados por entidad federativa

En el sitio http://mexicovid19.mx/ desarrollado por estudiantes y profesores del Tecnológico de Monterrey para visualizar y analizar los datos derivados de covid19 en México, tuvieron a bien publicarme esta breve nota.

El número absoluto de casos reportados como positivos por covid19 varía entre las entidades federativas de México, por lo que es importante conocer, con independencia del número de casos acumulados, cómo se comportan tales datos al ser graficados según la fecha de reporte. Esto nos permite observar una serie de curvas por entidad federativa…

Para seguir leyendo dar click aquí


Acercamiento a las probabilidades de hospitalización por grupo de edad a nivel nacional

En la plataforma www.mexicovid19.mx, la cual es un esfuerzo conjunto de un grupo de estudiantes y profesores del Tecnológico de Monterrey para dar seguimiento y fácil acceso a la información de salud más relevante en el contexto de la pandemia de Coronavirus en México, se publicó esta nota.

En síntesis, dicha nota trata sobre qué grupos de edad resultarían más susceptibles y en qué medida.  Para seguir leyendo dar click aquí.


Tiempo de duplicación de casos positivos reportados por entidad federativa

En la plataforma www.mexicovid19.mx, la cual es un esfuerzo conjunto de un grupo de estudiantes y profesores del Tecnológico de Monterrey para dar seguimiento y fácil acceso a la información de salud más relevante en el contexto de la pandemia de Coronavirus en México, se publicó esta nota.

En síntesis, dicha nota trata de ver en cuántos días los casos positivos llegan al doble por entidad federativa. Para seguir leyendo dar clic aquí


Una breve lista de quienes se dedican a visualización de datos

Esta es una breve lista de algunas personas o grupos que se dedican a visualización de datos, sea a través de R o de otras herramientas.

Como toda lista, se encuentra en proceso y puede contener a quienes no sólo se dedican a visualizaciones, sino que trabajan en desarrollo escribiendo códigos o a machine learning. No lleva ningún orden, aparecen como fui recopilando la información.

Se hallarán tres líneas: una es el nombre de la persona o grupo, otra es su página de internet y la tercera su cuenta de twitter.

 

– Code like a girl

https://code.likeagirl.io/espanol/home

@Code_LikeAGirl

 

– R ladies cdmx

https://rladies.org/

@RLadiesCDMX

 

– Diego Valle-Jones

https://elcri.men
https://hoyodecrimen.com
blog.diegovalle.net

@diegovalle

 

– Irving MA

http://www.morlan.mx/

@moaimx

 

– La Data

http://ladata.mx

@ladatamx

 

– Data Cívica

datacivica.org

@datacivica

 

– tacos de datos

https://tacosdedatos.com/

@tacosdedatos

 

– Jeremy Howard

https://www.fast.ai/

@jeremyphoward

 

– Antonieta Carrasco

nacion321.com

@antuanVisual

 

– Sebastián Garrido

http://segasi.com.mx/

@segasi

 

– Amalia Pulido

https://amaliapulido.wixsite.com/mysite

@pulido_amalia

 

– R-Ladies Xalapa

https://www.meetup.com/es-ES/rladies-xalapa/

@RLadiesXalapa


Sugerencias sobre material para aprender series de tiempo

A reserva de agregar más sugerencias, van estos cinco vínculos que podrían ayudar en el aprendizaje de series de tiempo:

— Rahlf using R

http://www.datavisualisation-r.com/category/time-series/

— 162 book suggestions to learn R

https://www.r-project.org/doc/bib/R-books.html

— “Top Books on Time Series Forecasting With R” by Jason Brownlee

https://machinelearningmastery.com/books-on-time-series-forecasting-with-r/

— An interesting compilation of time series material by prof @robjhyndman

https://robjhyndman.com

— “A Little Book of R For Time Series” by Avril Coghlan

Click to access a-little-book-of-r-for-time-series.pdf

— Análisis estadístico de series de tiempo económicas generadas con datos oficiales por Víctor M. Guerrero

Click to access RDE_07_Art2.pdf


Financiamiento público federal a partidos políticos en México, 1991-2018

En cuatro de los años con elecciones presidenciales en las últimas dos décadas (2000, 2006, 2012 y la próxima en 2018), el país ha destinado en cada uno de esos años, alrededor de 6 mil millones de pesos reales en financiamiento público federal a partidos políticos. De hecho, más de 6 mil millones se han entregado en seis ocasiones si se consideran dos años de elecciones intermedias: 1997 y 2003.

Que en cuatro años de elecciones presidenciales, dentro de las últimas dos décadas se destinara un monto similar de financiamiento público federal a partidos políticos sugiere un problema de diseño institucional.

La promesa de las reformas electorales después de la acaecida en 1996 (la llamada “reforma electoral definitiva” por su carácter fundacional) se centró, al menos en el tema del financiamiento público federal a los partidos políticos, en su reducción.

Desde luego que al examinar los datos ofrecidos en la gráfica que acompaña a estas breves notas, bien se puede concluir que en términos reales no ha aumentado el financiamiento público federal a los partidos políticos, esto durante años de elecciones presidenciales, lo cual sí parece ser el caso.

Sin embargo, la promesa de las reformas electorales no fue mantener sino reducir ese financiamiento. ¿Porqué esto puede ser un problema? Estamos dedicando como país un monto de fondos públicos similar, en términos reales, a años de elección presidencial con realidades distintas. Por ejemplo, en 2000 y 2006 la presencia en radio y TV se pagaba, pero en 2012 y para el próximo 2018, esa presencia se cubrió y se cubrirá con tiempos del Estado. ¿Esto hace una diferencia? Sirva de ilustración un viejo cálculo de 1997: en aquél año se estimó que el 60 por ciento de los gastos de los partidos se destinaban a financiar apariciones en radio y TV. Hoy esto ya no se paga. Sin embargo, los fondos federales siguen siendo los mismos.

Todo lo anterior supone la necesidad de examinar lo que el arreglo institucional implica en términos de financiamiento público federal a los partidos políticos en México. ¿Es sostenible este patrón de asignaciones de fondos federales? La frase en las comunicaciones del órgano electoral nacional (“sólo aplica, no decide”) sobre la materia de financiamiento público sugiere que implícitamente se reconoce la impopularidad de este arreglo institucional (o al menos eso sería posible argüir).

Como en toda acción pública para realizar este necesario examen, sería útil responderse al menos estas tres preguntas ¿Qué es lo deseable? ¿qué es lo posible? ¿que es lo sostenible en el mediano plazo? Por ahora, el actual arreglo institucional pareciera tener algunos problemas en su diseño.

Gráfica.
Financiamiento público federal a partidos políticos en México, 1991-2018.

finan1991_2018federal


Presencia electoral del PRI en Coahuila 1981-2017

Este post sólo consta de un par de gráficas que condensan 26 elecciones en el estado de Coahuila entre 1981 y 2017. Se trata de 10 elecciones federales y 16 locales.

La primera gráfica separa la presencia electoral del Partido Revolucionario Institucional (PRI) entre elecciones federales y elecciones locales. Se trata del porcentaje de votación obtenida por el PRI considerando al estado como un todo.

coah_1981_2017

La segunda gráfica incluye ambos tipos de elecciones, esto es, tanto locales como federales y se estima una tendencia entre los puntos que corresponden a la presencia electoral del PRI en Coahuila durante los últimos 36 años.

coah_1981_2017_junto

Si bien se trata de un ejercicio preliminar que agrupa en cuanto fue posible el porcentaje de votos del PRI considerando la votación total, resulta posible observar que entre 1981 y 1991 el PRI no descendía de los 50 puntos. Será durante los años noventa y entrado el nuevo milenio cuando ya no necesariamente obtenga una mayoría absoluta de votos.

Para finales de la década pasada y principios de la presente parecía observarse cierta recuperación, aunque no del todo, para alcanzar excepto por 2014, un quinquenio de resultados en el agregado estatal que fueron menores al 50 por ciento de los votos de la ciudadanía coahuilense.

Todo lo anterior sugiere que una coalición opositora, una vez conocidos los apretados resultados de 2017, bien pudiera disputar la gubernatura al PRI de forma altamente competitiva y con alta probabilidad de éxito en una de las pocas entidades donde ningún otro partido ha alcanzado a ganar el poder ejecutivo del estado.


Valores morales y tradicionalismo: Jalisco vs el resto del país

El pasado sábado 25 de julio de 2015 diversas organizaciones marcharon en la ciudad de Guadalajara para demandar que las leyes no permitan el matrimonio entre personas del mismo sexo, que la jurisprudencia de la SCJN recientemente aprobada sobre el tema sea revocada (lista de sentencias y tesis) y se respete la patria potestad de los padres de familia, por lo que también exigen reformas a la Ley General de los Derechos de los Niños, Niñas y Adolescentes (Notas del 25 de julio del Informador y del 26 de julio de Mural, en su primera plana).

Aunque las manifestaciones tuvieron réplicas en otros lugares del país, la efectuada en Guadalajara ha sido la que ha llamado la atención de diversos columnistas. Sin embargo, poco se ha analizado, al menos en términos de opinión pública, lo que estas expresiones representan como fenómeno social, más allá de simplemente decir que se trata de un mero conservadurismo moral.

A reserva de escudriñar datos de encuestas más recientes que resulten representativas a nivel entidad federativa, se efectuó un primer análisis sobre algunas variables relacionadas con una idea general sobre lo que pudiera entenderse por ser conservador, sin que ello signifique que el concepto se agote en este ejercicio.

El ejercicio estadístico que se realizó es una diferencia de medias, es decir, el valor promedio de las respuestas a una pregunta de encuesta se compara entre dos grupos. Los dos grupos están conformados por los habitantes de Jalisco y por quienes viven en el resto del país.

Los datos provienen de la ENVUD (Encuesta Nacional sobre Valores: Lo que une y divide a los mexicanos) levantada entre el 13 de noviembre y el 15 de diciembre de 2010, con 15,910 entrevistas en todo el país, y con representatividad a nivel estatal, pues por ejemplo, en Jalisco se levantaron 700 entrevistas (con factores de expansión esto significa 4’871,358 casos). Aquí puede hallarse la ENVUD.

En la Tabla 1 se muestran 9 preguntas incluidas en la ENVUD 2010, que versan sobre una idea general respecto a lo conservador. En particular, se analizan el orgullo sobre costumbres y tradiciones, si se considera que las religiones unen y no dividen a los mexicanos y el nivel de confianza en las iglesias. También se agregan preguntas sobre valores morales, como actitudes hacia el matrimonio entre personas del mismo sexo, la homosexualidad, el aborto, el divorcio, la eutanasia (también conocida como muerte asistida), y hasta dónde se justifica la violencia doméstica.

La diferencia de medias reveló que los jaliscienses reportan estar más orgullosos de las costumbres y tradiciones que el resto de los mexicanos, de igual manera son más proclives a considerar que las religiones unen a las personas, y también muestran una mayor confianza en las iglesias. Todo ello pudiera tener sentido en el contexto de una sociedad jalisciense relativamente tradicional, que también ha estado marcada por una historia religiosa que incluso se remonta en algunos lugares del estado a la propia guerra Cristera, como lo menciona Jean Meyer en su estudio sobre la  Cristiada  de 1973.

En términos de valores morales se observa que en la entidad sí existe un rechazo mayor al matrimonio entre personas del mismo sexo, pero destaca que el rechazo a la homosexualidad (sin aludir en la pregunta al matrimonio igualitario) no es estadísticamente distinto entre Jalisco y el resto del país, o no lo era a finales de 2010. Este dato desafortunadamente ha pasado prácticamente desapercibido por los columnistas.

En otros temas morales como el rechazo al aborto, al divorcio y a la eutanasia, Jalisco muestra una diferencia estadística con el resto del país que indica que sus habitantes son más proclives a no justificar estos temas.

Finalmente, la violencia doméstica se midió del 1 al 10 “usted qué tanto justifica que un hombre le pegue a su esposa” donde 1 es nunca se justifica y 10 es siempre se justifica. Los resultados indican que en Jalisco esta aceptación es estadísticamente distinta al resto del país, e incluso es menor en Jalisco que en otros lugares de México. Este es un segundo dato que tampoco se ha incluido en los análisis sobre lo que significa ser conservador o tradicionalista en nuestras sociedades.

Todo ello nos sugiere que la dimensión de lo que podríamos entender por conservadurismo o tradicionalismo, sea moral o religioso, no es fácilmente reducible a una o dos frases, se requiere de un trabajo adicional de exploración de datos y argumentos que permitan entender paso a paso fenómenos sociales complejos. Y este “post” apenas empieza a apuntar en esa dirección…

Tabla 1

jaliscomoral

Nota: 0.1*, 0.05**, 0.01***

Fuente: ENVUD 2010, cálculos del autor (diferencia de medias usando las rutinas ttest, robvar y ttest unequal en Stata).

 

 

 


%d bloggers like this: