Viernes, 8 de Mayo de 2009
¿Cuántas personas conoces?
Con esto de la influenza A/H1N1, al margen de las opiniones más o menos razonables en referencia a la forma en la que ha actuado el gobierno mexicano, han surgido muchas teorÃas de la conspiración. Las hay desde los que dicen que se trata de un virus creado por gobiernos en contra de la población, hasta los que dicen que es un simple simulacro, pasando los que dicen que se trata de un plan para reactivar la economÃa del mundo.
Me voy a centrar aquà en una pregunta que (en diferentes variantes) he encontrado en forma recurrente (por ejemplo, aquà y aquÃ) como respaldo a la idea de que el problema no es grave (o que de plano no existe) es la pregunta de ¿A cuantos muertos conoces?
La pregunta es válida en el contexto adecuado. Por desgracia, siempre que me he encontrado con ella ha sido como un simple recurso retórico. Hace unos años se puso de moda la postura de los negacionistas del VIH como causa del SIDA. En esa ocasión, con un compañero de trabajo platicábamos acerca de eso y él me comentó que lo que le parecÃa muy extraño es no conocer a nadie que tuviera SIDA.
El caso que me parece más interesante es el del autor del blog Guffo Caballero, quien publicó un post en el que empieza haciendo referencia a la teorÃa de los seis grados de separación, para a continuación preguntar si alguno de los lectores de ese post conocÃa directa o indirectamente a alguien que hubiera muerto a causa de la influenza.
Antes de continuar, debo aclarar que Guffo no propone ni respalda ninguna teorÃa de la conspiración y que considero que la pregunta es válida y adecuada en el contexto de la epidemia. Voy incluso más allá y considero válido tener y manifestar dudas sobre la realidad de la gravedad de la epidemia, aunque no asà asegurar que el virus no existe, que no es peligroso o que nos están fumigando desde el aire para simular la pandemia. Estoy usando el post de Guffo solo para ilustrar que la pregunta “¿Conoces a alguien…?†no tiene sentido a menos que se tome en el contexto de probabilidades para cada caso. En ese sentido, la pregunta tendrÃa que ser algo asà como “Si ha habido 50 decesos en la ciudad en donde vivo ¿Qué probabilidad hay de que yo no conozca a ninguno de ellos, ni directa ni indirectamente?â€. Creo que esta pregunta sà se puede contestar y aunque la intuición nos dice que se trata de una probabilidad muy baja, creo que es mejor evaluarla para saber de que estamos hablando.
La herramienta que aplica para responder este tipo de preguntas es la distribución de Poisson, la cual está elaborada para analizar las probabilidades de ocurrencia de eventos en periodos de tiempo, pero como las matemáticas no distinguen entre tiempo, espacio o conjuntos, igual podemos aplicar esta distribución a la probabilidad de ocurrencia de eventos (casos de enfermedades o decesos) en una determinada población (Ver Nota 1)
La fórmula para el cálculo de probabilidades según la distribución de Poisson es:
Me voy a centrar aquà en una pregunta que (en diferentes variantes) he encontrado en forma recurrente (por ejemplo, aquà y aquÃ) como respaldo a la idea de que el problema no es grave (o que de plano no existe) es la pregunta de ¿A cuantos muertos conoces?
La pregunta es válida en el contexto adecuado. Por desgracia, siempre que me he encontrado con ella ha sido como un simple recurso retórico. Hace unos años se puso de moda la postura de los negacionistas del VIH como causa del SIDA. En esa ocasión, con un compañero de trabajo platicábamos acerca de eso y él me comentó que lo que le parecÃa muy extraño es no conocer a nadie que tuviera SIDA.
El caso que me parece más interesante es el del autor del blog Guffo Caballero, quien publicó un post en el que empieza haciendo referencia a la teorÃa de los seis grados de separación, para a continuación preguntar si alguno de los lectores de ese post conocÃa directa o indirectamente a alguien que hubiera muerto a causa de la influenza.
Antes de continuar, debo aclarar que Guffo no propone ni respalda ninguna teorÃa de la conspiración y que considero que la pregunta es válida y adecuada en el contexto de la epidemia. Voy incluso más allá y considero válido tener y manifestar dudas sobre la realidad de la gravedad de la epidemia, aunque no asà asegurar que el virus no existe, que no es peligroso o que nos están fumigando desde el aire para simular la pandemia. Estoy usando el post de Guffo solo para ilustrar que la pregunta “¿Conoces a alguien…?†no tiene sentido a menos que se tome en el contexto de probabilidades para cada caso. En ese sentido, la pregunta tendrÃa que ser algo asà como “Si ha habido 50 decesos en la ciudad en donde vivo ¿Qué probabilidad hay de que yo no conozca a ninguno de ellos, ni directa ni indirectamente?â€. Creo que esta pregunta sà se puede contestar y aunque la intuición nos dice que se trata de una probabilidad muy baja, creo que es mejor evaluarla para saber de que estamos hablando.
La herramienta que aplica para responder este tipo de preguntas es la distribución de Poisson, la cual está elaborada para analizar las probabilidades de ocurrencia de eventos en periodos de tiempo, pero como las matemáticas no distinguen entre tiempo, espacio o conjuntos, igual podemos aplicar esta distribución a la probabilidad de ocurrencia de eventos (casos de enfermedades o decesos) en una determinada población (Ver Nota 1)
La fórmula para el cálculo de probabilidades según la distribución de Poisson es:
En la cual, los sÃmbolos tienen el siguiente significado
k es el número de ocurrencias de un evento.
La letra griega lambda es el número esperado de ocurrencias para el mismo evento.
e es la base de los logaritmos naturales (2.71828182845905…)
La f calculada es la probabilidad de que en un determinado periodo, el evento cuyo número esperado es lambda sea k.
Ahora pongámosle números:
Digamos que una persona (llamémosle MarÃa) vive en la ciudad de México, la cual tiene una población de unos 8.8 millones de personas, según el INEGI, y 673 casos de influenza, según la SecretarÃa de Salud ¿Cuántas personas conoce MarÃa? De acuerdo con el artÃculo de wikipedia sobre los 6 grados de separación, cada persona tiene contacto con otras 100 en forma aproximada. No soy el campeón de la popularidad pero creo que deben ser más. en la empresa en que trabajo hay unas 70 personas y los conozco a todos, además de que tengo unos 15 amigos, los cuales tienen pareja e hijos, con lo cual debe haber otras 70 personas, y eso sin contar a mis familiares hasta primos segundos y sus parejas e hijos, que tal vez sean otros 50, más personas de otras empresas con las que tengo contacto esporádico, algunos vecinos, de los que sólo contarÃa aquellos con los que he platicado en más de dos ocasiones al año. Redondeando creo que considerar a mis conocidos como unos 200 sin estar muy lejos de la realidad.
Ahora puedo contestar la pregunta ¿Si hay 673 casos de influenza A/H1N1 en la ciudad de México ¿Qué probabilidad hay de que MarÃa no conozca a ninguno de ellos, ni directa ni indirectamente?â€
Los números serÃan:
k = 0,
Porque MarÃa no conocerÃa a ninguno
lambda = 200 X (673 / 8 800 000) = 0.0153
La cantidad esperada de casos para una muestra de 200 si se conserva la misma proporción que la de la población.
Con esos números, la probabilidad obtenida serÃa de f = 98.48%, la cual lo suficientemente alta como para explicar que MarÃa no conozca a ninguno sin que parezca algo insólito.
Si considero que buena parte de la población del Estado de México interactúa con los habitantes del Distrito federal, la cantidad de casos aumenta a 780, pero la población se incrementa a unos 20 millones de habitantes, con lo que la probabilidad de no conocer a ningún enfermo aumenta a 99.22%, que para el caso es lo mismo.
Ahora bien, la pregunta de Guffo se refiere a personas fallecidas y no a enfermos, con lo que la probabilidad de no conocer a nadie andarÃa en el rango del 99.95%.
Lo extraño es que en un post posterior, Guffo menciona que sà tuvo respuestas afirmativas a su pregunta. EspecÃficamente 17 personas afirmaron conocer a alguno de los fallecidos. Dados los números arriba mencionados, no es razonable pensar que eso sea cierto. Una de dos: o los que comentaron en el post mienten en su mayorÃa, o las cifras de la SecretarÃa de Salud son falsas (hacia abajo) o una combinación de ambas. Yo me inclino por la primera opción, ya que en los blogs se puede comentar en forma anónima (incluso si te das de alta y pones un nick). En ese sentido, la reacción de Guffo es correcta: no es lógico que haciendo la pregunta en un post de su blog, en el que obtiene 86 comentarios, reciba respuesta positiva sobre 17 casos. Pero también cabe la pregunta ¿Qué esperaba Guffo en primer lugar? ¿Qué hubiera tan pocos casos como para respaldar su argumento de que la realidad está manipulada y exagerada? Después de todo, lo esperado a partir de los datos del gobierno era que todos respondieran que no conocÃan a nadie que hubiera fallecido a causa de la influenza A H1N1. A partir de ahà se puede concluir que los números del gobierno (y de la Organización Mundial de la Salud) son razonables y que lo que puede estar siendo exagerado es el riesgo potencial, pero ese no se puede medir con la pregunta de Guffo.
Ahora vamos a lo del SIDA. Según el reporte 2008 de la OMS, en México habrÃa al cierre de 2007, unos 200,000 casos de personas con el virus de la inmunodeficiencia humana. Aplicando la misma fórmula para una población total de 106 millones de habitantes, la probabilidad de que ninguno de mis 200 conocidos tenga el VIH es de un 68.57%, lo que me deja con una probabilidad de 31.43% de conocer a alguien con VIH. No deberÃa ser extraño conocer a alguien que tuviera VIH, aunque es poco probable que me tenga la suficiente confianza como para decÃrmelo. Sin embargo, no todos estos 200,000 casos de VIH desarrollan SIDA. Según el mismo reporte, el acumulado de casos reportados de SIDA en México es de 110,000, con lo que la probabilidad de conocer a alguien con esa enfermedad se reduce a 18.74%, lo suficientemente alta como para que entre mi grupo de conocidos tenga que haber alguien que conozca a un enfermo de SIDA en forma directa (y en realidad sÃ, lo hay). En vista de eso, no parece exagerado tomar las precauciones recomendadas para prevenir el contagio del VIH.
La pregunta “¿Cuántos casos conoces…?†es válida como origen de un planteamiento a partir del cual se exploren los resultados obtenidos contra los esperados. No es válida si se usa como un recurso retórico por sà misma, como si estoy en una reunión con algunos amigos y, para pretender demostrar que el SIDA es una leyenda, decimos “¿Conoce alguno de ustedes a algún enfermo de SIDA?â€, para saltar de la respuesta negativa de todos a la conclusión de que existe una conspiración de los illuminati para mantenernos aterrorizados.
* * *
k es el número de ocurrencias de un evento.
La letra griega lambda es el número esperado de ocurrencias para el mismo evento.
e es la base de los logaritmos naturales (2.71828182845905…)
La f calculada es la probabilidad de que en un determinado periodo, el evento cuyo número esperado es lambda sea k.
Ahora pongámosle números:
Digamos que una persona (llamémosle MarÃa) vive en la ciudad de México, la cual tiene una población de unos 8.8 millones de personas, según el INEGI, y 673 casos de influenza, según la SecretarÃa de Salud ¿Cuántas personas conoce MarÃa? De acuerdo con el artÃculo de wikipedia sobre los 6 grados de separación, cada persona tiene contacto con otras 100 en forma aproximada. No soy el campeón de la popularidad pero creo que deben ser más. en la empresa en que trabajo hay unas 70 personas y los conozco a todos, además de que tengo unos 15 amigos, los cuales tienen pareja e hijos, con lo cual debe haber otras 70 personas, y eso sin contar a mis familiares hasta primos segundos y sus parejas e hijos, que tal vez sean otros 50, más personas de otras empresas con las que tengo contacto esporádico, algunos vecinos, de los que sólo contarÃa aquellos con los que he platicado en más de dos ocasiones al año. Redondeando creo que considerar a mis conocidos como unos 200 sin estar muy lejos de la realidad.
Ahora puedo contestar la pregunta ¿Si hay 673 casos de influenza A/H1N1 en la ciudad de México ¿Qué probabilidad hay de que MarÃa no conozca a ninguno de ellos, ni directa ni indirectamente?â€
Los números serÃan:
k = 0,
Porque MarÃa no conocerÃa a ninguno
lambda = 200 X (673 / 8 800 000) = 0.0153
La cantidad esperada de casos para una muestra de 200 si se conserva la misma proporción que la de la población.
Con esos números, la probabilidad obtenida serÃa de f = 98.48%, la cual lo suficientemente alta como para explicar que MarÃa no conozca a ninguno sin que parezca algo insólito.
Si considero que buena parte de la población del Estado de México interactúa con los habitantes del Distrito federal, la cantidad de casos aumenta a 780, pero la población se incrementa a unos 20 millones de habitantes, con lo que la probabilidad de no conocer a ningún enfermo aumenta a 99.22%, que para el caso es lo mismo.
Ahora bien, la pregunta de Guffo se refiere a personas fallecidas y no a enfermos, con lo que la probabilidad de no conocer a nadie andarÃa en el rango del 99.95%.
Lo extraño es que en un post posterior, Guffo menciona que sà tuvo respuestas afirmativas a su pregunta. EspecÃficamente 17 personas afirmaron conocer a alguno de los fallecidos. Dados los números arriba mencionados, no es razonable pensar que eso sea cierto. Una de dos: o los que comentaron en el post mienten en su mayorÃa, o las cifras de la SecretarÃa de Salud son falsas (hacia abajo) o una combinación de ambas. Yo me inclino por la primera opción, ya que en los blogs se puede comentar en forma anónima (incluso si te das de alta y pones un nick). En ese sentido, la reacción de Guffo es correcta: no es lógico que haciendo la pregunta en un post de su blog, en el que obtiene 86 comentarios, reciba respuesta positiva sobre 17 casos. Pero también cabe la pregunta ¿Qué esperaba Guffo en primer lugar? ¿Qué hubiera tan pocos casos como para respaldar su argumento de que la realidad está manipulada y exagerada? Después de todo, lo esperado a partir de los datos del gobierno era que todos respondieran que no conocÃan a nadie que hubiera fallecido a causa de la influenza A H1N1. A partir de ahà se puede concluir que los números del gobierno (y de la Organización Mundial de la Salud) son razonables y que lo que puede estar siendo exagerado es el riesgo potencial, pero ese no se puede medir con la pregunta de Guffo.
Ahora vamos a lo del SIDA. Según el reporte 2008 de la OMS, en México habrÃa al cierre de 2007, unos 200,000 casos de personas con el virus de la inmunodeficiencia humana. Aplicando la misma fórmula para una población total de 106 millones de habitantes, la probabilidad de que ninguno de mis 200 conocidos tenga el VIH es de un 68.57%, lo que me deja con una probabilidad de 31.43% de conocer a alguien con VIH. No deberÃa ser extraño conocer a alguien que tuviera VIH, aunque es poco probable que me tenga la suficiente confianza como para decÃrmelo. Sin embargo, no todos estos 200,000 casos de VIH desarrollan SIDA. Según el mismo reporte, el acumulado de casos reportados de SIDA en México es de 110,000, con lo que la probabilidad de conocer a alguien con esa enfermedad se reduce a 18.74%, lo suficientemente alta como para que entre mi grupo de conocidos tenga que haber alguien que conozca a un enfermo de SIDA en forma directa (y en realidad sÃ, lo hay). En vista de eso, no parece exagerado tomar las precauciones recomendadas para prevenir el contagio del VIH.
La pregunta “¿Cuántos casos conoces…?†es válida como origen de un planteamiento a partir del cual se exploren los resultados obtenidos contra los esperados. No es válida si se usa como un recurso retórico por sà misma, como si estoy en una reunión con algunos amigos y, para pretender demostrar que el SIDA es una leyenda, decimos “¿Conoce alguno de ustedes a algún enfermo de SIDA?â€, para saltar de la respuesta negativa de todos a la conclusión de que existe una conspiración de los illuminati para mantenernos aterrorizados.
* * *
Nota 1: En realidad yo no estaba tan seguro de poder aplicar la distribución de Poisson en este caso, por lo que hice una comparación utilizando combinaciones, observando que conforme aumenta el tamaño de la población considerada, la probabilidad calculada se aproxima a la obtenida con la fórmula de Poisson. Por desgracia, los sistemas de hoja de cálculo de que dispongo no permiten hacer cálculos para poblaciones grandes, y no soy tan masoquista como para intentar hacer los cálculos a mano. Si alguien quiere el archivo de Excel en el que hice la comparación, con gusto se lo enviaré por correo electrónico.
Nota 2: Este post no pretende tratar en forma exhaustiva el tema de la influenza A/H1N1. Pero entre los blogueros amigos recomiendo el post de Pereque titulado “Influenza Porcinaâ€, y la serie de Lord Eggs (el primo de Jack Maybrick) referente a la Influenza A H1N1.
Nota 3: Los que todavÃa no conocen de qué va eso de las peleas de brutos, pueden hacerse alumnos de mi hijo mayor en http://tecolido.elbruto.es/
Referencias:
EstadÃsticas de la SecretarÃa de Salud referentes a la influenza A H1N1 en México:
http://portal.salud.gob.mx/contenidos/noticias/influenza/estadisticas.html
Datos del INEGI sobre población en México:
http://www.inegi.org.mx/est/contenidos/espanol/proyectos/conteos/conteo2005/bd/consulta2005/pt.asp?s=est&c=10401
Reporte de la Organización Mundial de la Salud sobre el VIH y el SIDA en México.
http://apps.who.int/globalatlas/predefinedReports/EFS2008/full/EFS2008_MX.pdf