miércoles, enero 11, 2012

Nelson contra Bayes, o las probabilidades y el cáncer de la presidenta

Para barrenar el batifondo mediático generado en torno al cáncer que se le diagnosticó erróneamente a la presidenta de la nación, vale la pena discutir una sutileza respecto de la interpretación de los resultados de un test cualquera, la cual al ser ignorada genera enorme confusión.
Supongamos que se pretende detectar una cierta enfermedad en un dado paciente. Las posibilidades son obviamente dos, o bien "el paciente está enfermo" (denotemos esta proposición como e) o bien "el paciente está sano" (denotémosla como s), es decir que sabemos con certeza que e O s es una proposición verdadera. Por lo tanto, si pretendemos asignar una probabilidad a cada una de estas posibilidades, tendremos que P(e O s) = 1. Si llamamos P(e) a la probabilidad de "el paciente está enfermo", y P(s) a la de "el paciente está sano" tendremos, aplicando una de las reglas básicas del cálculo de probabilidades, que P(e O s) = P(e) + P(s) = 1, lo que implica que P(e) = 1 - P(s). En el caso del cáncer de tiroides que se le diagnosticó a la presidenta, la incidencia en la población general es de un 20-50 casos por cada millón de personas (*). A los fines de esta discusión, promediemos estos números en 35 casos por cada millón de personas, de donde tenemos que la probabilidad de que una persona cualquiera esté enferma es P(e) = 0,000035, y de que esté sana (**) es P(s)= 1 - P(e) = 0,999965.

Para detectar la enfermedad sometemos al paciente a un dado estudio, cuyo resultado se limita a las opciones "el resultado da positivo" (que llamaremos p) o "el resultado da negativo" (que llamaremos n). Razonando igual que en el párrafo anterior, sabemos que sus probabilidades satisfacen P(p) = 1 - P(n). Ahora bien, ningún estudio es perfecto, y siempre existe la eventualidad de obtener un resultado equivocado. Llamemos p|s a la proposición "el resultado es positivo cuando el paciente está sano" (que se conoce como "falso positivo"), y P(p|s) a su probabilidad. En el caso del estudio que se le aplicó a la presidenta, éste dá falsos positivos un 2% de las veces, con lo que tenemos P(p|s) = 0,02. Por supuesto, también existe la opción del "falso negativo", es decir de que se verifique la proposición "el resultado es negativo cuando el paciente está enfermo" que llamaremos n|e. En el caso en cuestión, supondremos que su probabilidad satisface P(n|e) = 0,02. Notemos que, dado que para un paciente enfermo el test debe dar o bien positivo o bien negativo, razonando como en el párrafo anterior podemos deducir P(p|e) = 1 - P(n|e) (y una fórmula análoga para un paciente sano, que no nos será de utilidad en lo que sigue). Para el caso de la presidenta esto implica que P(p|e) = 0,98. Este es el famoso "98% de efectividad del test" que mencionan los medios oficialistas. 

Notemos que la proposición "el resultado es positivo" puede ser verdadera si "el resultado es positivo cuando el paciente está enfermo" y "el paciente está enfemo", o si "el resultado es positivo cuando el paciente está sano" y "el paciente está sano". Eso nos permite escribir que P(p) = P( (p|s Y s) O (p|e Y e) ). Usando las reglas del cálculo de probabilidades, podemos reescribir esta fórmula como P(p) = P(p|s Y s) + P(p|e Y e) = P(p|s)P(s) + P(p|e)P(e). En nuestro caso, si ponemos los números obtenemos P(p) = 0,02 x  0,999965 + 0,98 x 0,000035 = 0,02. 

Con estos datos, queremos calcular cual es la probabilidad de la proposición "el paciente esta enfermo cuando el resultado es positivo", que llamaremos P(e|p). Sólo si esta probabilidad es alta debería el médico recomendar algún tratamiento, lo que en el caso de la enfermedad que se le diagnosticó a Cristina Fernández involucraría una intervención quirúrgica. Para hacer ese cálculo existe un teorema conocido como "regla de Bayes" que establece que

P(e|p) P(p) = P(p|e) P(e)

de aquí podemos despejar P(e|p) = P(p|e) P(e) / P(p) lo que en nuestro caso y con los números en la mano nos da

P(e|p) = 0.98 x 0.00003 / 0.02 = 0,001

Es decir que es una probabilidad bastante baja, sólo una de cada mil personas que reciban un diagnóstico positivo con el mencionado test estará realmente enferma ¿Cómo se interpreta este resultado? ¿Cómo puede ser que la probabilidad real de que la presidenta estuviera enferma fuera tan baja, cuando obtuvo un resultado positivo en un estudio que funciona bien el 98% de las veces? La respuesta está en que, más alla de la efectividad del test, hay información extra que se debe tener en cuenta. En particular, la incidencia de la enfermedad en la población general, codificada en nuestra fórmula a través de P(e), es muy baja, lo que potencia la posibilidad de que un resultado positivo sea en realidad un falso positivo.
Obviamente, y suponiendo que los números arriba insertados sean los correctos, en ausencia de otros estudios o síntomas que avalaran la hipótesis de la presencia de la enfermedad, no se hubiera debido recomendar la intervención. Este error, el no aplicar correctamente la regla de Bayes, es lamentablemente muy común entre los galenos. Y no sólo en la Argentina, varios estudios hechos entre médicos estadounidenses demostraron que solo un pequeño grupo sabe usarla correctamente para valorar el peso de un estudio en el proceso de diagnostico, y lo hace como rutina. 

__________________________________

(*) Este dato está tomado de aquí, es muy probable que si se discrimina por sexo y grupo etario esta probabilidad sea bastante más alta, con lo que el resultado final para P(E|P) sería mayor. Honestamente no creo que tal aumento en el resultado final altere sustancialmente la conclusión.

(**)  En lo que respecta al cáncer de tiroides, siempre podría sufrir de alguna otra enfermedad.