«Las cifras a menudo me seducen,
particularmente cuando tengo que arreglarlas yo mismo; en cuyo caso la
observación atribuida a Disraeli a menudo se aplicaría con justicia y fuerza:
"Hay tres tipos de mentiras: mentiras, malditas mentiras y estadísticas"». Mark Twain.
Lo que
empezó con juegos de azar allá por el siglo XVII con Pascal, hoy es utilizado hasta para teorizar sobre Dios, “e incluso si la existencia de Dios
nunca es probada o refutada con certeza de una manera u otra, la evidencia
disponible y el razonamiento pueden arrojar una estimación de la probabilidad
lejos del 50 por ciento”, razona Richard Dawkins[1].
Es una
realidad el hecho de que nos encanta razonar en términos probabilísticos, tengan
o no algún sentido[2].
David: ¿Cuál crees que es la probabilidad de que llegue un autobús en los próximos cinco minutos?
Zaka: ¿Eh?
David: Estaba pensando en correr cuesta arriba para conseguir algunos cigarrillos. Me imagino que tomará tal vez cinco minutos. ¿Cuál cree que es la probabilidad de que llegue un autobús antes de que regrese?
Zaka: No lo sé. Un autobús podría venir
David: ¿Pero es probable?
Zaka: ¿Qué quieres decir?
David: ¿Sabes cuál es la probabilidad? ¿Hay una gran probabilidad de que llegue? ¿O solo una pequeña probabilidad?
Zaka: ¿Una probabilidad puede ser grande o pequeña?
David: Bueno, ¿es más como 1 entre 10? ¿O más como 50-50?
Zaka: ¿Cómo lo sabría? No sé cuándo llegará el autobús
Transcurría
así, una conversación del antropólogo David Graeber con un malgache donde
concluye, y no sin falta de razón:
“De hecho, descubrí no solo que esa forma de pensar era desconocida para la mayoría de los malgaches, sino también que, una vez explicada, parecía tan peculiar, exótica y finalmente insondable como cualquiera de esos conceptos antropológicos clásicos, como el mana, la baraka, o shakti, regularmente empleado en otras partes del mundo para poner un nombre en el juego del azar o para explicar coyunturas o eventos inexplicables.
Una vez que comencé a pensar en ello, me di cuenta de que esta perplejidad era una respuesta bastante razonable. Azar es en realidad un concepto muy peculiar. Zaka tenía razón: lo principal es que no sabemos cuándo llegará el autobús. Esto es lo único que podemos decir con certeza”[3].
Hoy, la estadística
y probabilidad se han convertido en la base de las ciencias sociales y no
parece que esto vaya a cambiar en los próximos años. Sucede, sin embargo, que
todo este solemne y tecnicismo matemático, construido muchas veces a fin de
dar por cerradas determinadas cuestiones gracias a la complejidad que supone para muchos, se mantiene
construido sobre un castillo de naipes invertido, lo que hace que, con un pequeño
toque a su base, la cual sostiene toda su estructura, lo demás caiga solo.
“Las
matemáticas nos dicen”, “son los números”, pronuncian los agoreros desde su
torre de marfil, con un prestigio social que no difiere tanto del chamán, de
modo que entre la bata blanca y las plumas de animal la distancia es más corta de lo que se piensa.
¿Qué
probabilidad tenemos de morir de tal forma? “Si bien algunas de estas preguntas
pueden parecer macabras, el Consejo Nacional de Seguridad frecuentemente recibe
estas consultas”, responde el “National Safety Council (NSC)”, de EEUU, cuya
condición de “oráculo de Delfos” le da la suficiente autoridad para realizar estos presagios.
0.02% de
morir en accidente de bici, aún más, 0.1% de probabilidad de morir ahogado, 1
entre 1086, según sus informes[4].
¿Pero, qué
hay de quien vive alejado de la costa, lago o piscinas, o a quien no le guste el agua?, ¿y quienes no tienen bicicleta?
Niño malgache[5].
Empecemos
por aquí:
¿Cuál es la
probabilidad del cara o cruz, 50%? No tan rápido, para una moneda de 5 centavos
estadounidenses, por ejemplo, aproximadamente 1 de cada 6 mil lanzamientos
caería de canto, dicho esto, la cara, más pesada, suele abarcar una
probabilidad mayor al 50% dependiendo de cada tipo de moneda[6].
Uno siempre puede, sin embargo, y es lo que se hace, suponer una probabilidad subjetiva, del 50%.
La
probabilidad de un suceso es, además, siempre un número infinito, indeterminable, en cuanto a que
siempre se puede ir saltando a una escala decimal más pequeña, como con
cualquier otra medida, siendo la función realmente acotar a ésta[7].
Dicho esto,
y esperando que haya sido comprendido medianamente en qué consiste la medición probabilística[8],
vayamos al suceso ergódico, y entenderemos qué pasa con las probabilidades de
los ciclistas en EEUU.
Según Wikipedia,
“Un sistema es ergódico si el único conjunto invariante de medida no nula de la
hipersuperficie de energía constante del espacio de las fases es toda la
hipersuperficie de energía constante”, es decir, que “sobre un período
prolongado de tiempo, el tiempo de permanencia en una dada región del espacio
de fase de micro estados con la misma energía es proporcional al volumen de la
región, o sea todos los micro estados accesibles son igualmente probables a lo
largo de un período prolongado”.
¿Quedó o no
claro? Bueno, si nos alejamos del lenguaje técnico con el que muchas veces intentan intimidar los gurús, quizás se entienda fácil:
Lancemos un
dado 500 veces, cuyos resultados pueden ir del 1 al 6 y, lancemos una única vez
500 dados. En este caso, el espacio de fases o espacio muestral, son los
posibles resultados, los cuales son 1, 2, 3, 4, 5 y 6.
Aquí tenemos los resultados[9], en principio prácticamente indiferenciables, parece que arrojar 500 veces un dado ofrece una distribución similar a lanzar 500 dados una vez. También podríamos, por último, simular qué sucede si lanzasemos 500 veces dos dados, esta vez diferentes, uno cuyas caras van del 1 al 6 y otro cuyas caras van del 7 al 12.
¿Mejor
verdad?
De hecho, los métodos estadísticos y probabilísticos que se emplean en ciencias sociales tienen su origen para sucesos ergódicos de carácter mecánico, buscando estudiar el movimiento de los gases o líquidos, es decir, el movimiento de los átomos o moléculas, cuya pluralidad está formada por conjuntos heterogéneos entre sí (los elementos de la tabla periódica mantienen distintas propiedades), pero con homogeneidad interior, cardinal (todas las partículas de un mismo elemento o todas las moléculas cuya composición de elementos es la misma, mantienen las mismas propiedades).
De hecho, los métodos estadísticos y probabilísticos que se emplean en ciencias sociales tienen su origen para sucesos ergódicos de carácter mecánico, buscando estudiar el movimiento de los gases o líquidos, es decir, el movimiento de los átomos o moléculas, cuya pluralidad está formada por conjuntos heterogéneos entre sí (los elementos de la tabla periódica mantienen distintas propiedades), pero con homogeneidad interior, cardinal (todas las partículas de un mismo elemento o todas las moléculas cuya composición de elementos es la misma, mantienen las mismas propiedades).
Un
sistema es ergódico entonces, cuando la probabilidad de estar en algún punto del espacio
muestral es equiprobable para todos, es decir, cuando todos sus elementos comparten igual probabilidad para cada suceso. Así, los
dados de 6 caras (del 1 al 6) al ser homogéneos entre sí, reproducen un sistema ergódico, pues la
probabilidad de salir de una determinada cara es la misma para todos los dados, todos comparten pues, la misma probabilidad.
Esto
significa que el resultado de lanzar un único dado 500 veces es similar a
lanzar 500 dados una única vez, ya que ambos comparten la misma probabilidad para
cada cara, y viceversa, de modo que lanzando 500 dados una única vez, podemos llegar a conocer la probabilidad
de un único dado de la misma forma que si éste hubiese sido lanzado 500 veces. Es decir, conocer a un individuo a lo largo del tiempo a partir del estudio de un conjunto en un único instante de tiempo (500 dados lanzados una única vez) y, también viceversa, podemos conocer el conjunto mediante
el estudio de un único individuo a lo largo de un periodo de tiempo (1 dado
lanzado 500 veces).
Esto se debe a que como todos los dados comparten la misma probabilidad para cada suceso al ser homogéneos, el lanzar 500 de ellos es exactamente el mismo experimento que que lanzar uno 500 veces, ya que no existe diferencia entre un dado u otro. Con probabilidad de 1/6 para cada cara, dará para una cara "X": (1/6)*500. Donde 500 puede ser el número de lanzamientos, o de dados lanzados una única vez.
Aquí, un ejemplo visual de proceso ergódico, que podría ser por ejemplo el movimiento de una molécula de agua dentro de un vaso que únicamente contiene a elementos de ésta, lo que al ser homogéneos entre sí haría que la molécula a lo largo de un periodo de tiempo se encontrase en todas las posiciones en las que han estado otras moléculas similares, llenando de ese modo el espacio muestral, posiciones o estados posibles (el volumen que ocupa el agua).
Al ser ergódico supone pues, que conociendo el volumen que ocupa el agua en el vaso, conocemos la probabilidad de que una de estas partículas esté en una determinada posición:
Esto se debe a que como todos los dados comparten la misma probabilidad para cada suceso al ser homogéneos, el lanzar 500 de ellos es exactamente el mismo experimento que que lanzar uno 500 veces, ya que no existe diferencia entre un dado u otro. Con probabilidad de 1/6 para cada cara, dará para una cara "X": (1/6)*500. Donde 500 puede ser el número de lanzamientos, o de dados lanzados una única vez.
Aquí, un ejemplo visual de proceso ergódico, que podría ser por ejemplo el movimiento de una molécula de agua dentro de un vaso que únicamente contiene a elementos de ésta, lo que al ser homogéneos entre sí haría que la molécula a lo largo de un periodo de tiempo se encontrase en todas las posiciones en las que han estado otras moléculas similares, llenando de ese modo el espacio muestral, posiciones o estados posibles (el volumen que ocupa el agua).
Al ser ergódico supone pues, que conociendo el volumen que ocupa el agua en el vaso, conocemos la probabilidad de que una de estas partículas esté en una determinada posición:
Vayamos al segundo caso, de dados heterogéneos, en el que los dados difieren. Aquí el sistema no resulta ser
ergódico, ya que los dados no son homogéneos, por lo que estudiar al conjunto (donde la probabilidad es de 1/12
para cada cara), no nos permite conocer la probabilidad de ningún dado (1/6
de probabilidad para cada cara).
De forma análoga,
el agua mantiene unas propiedades distintas del aceite, por lo que la
probabilidad de que una molécula de agua se encuentre en la superficie es nula
(del mismo modo a que nos salga un 12 con un dado enumerado del 1 al 6), al
igual que la probabilidad de que una molécula de aceite baje hasta tocar el
fondo (similar a que el dado enumerado del 7 al 12 nos diera un 1).
Aquí un ejemplo visual de proceso no ergódico, lo que podría ser de nuevo el movimiento de una molécula de agua dentro de un vaso que contiene esta vez, no sólo agua, sino otros líquidos de distinta densidad, de modo que a lo largo del tiempo no termina encontrándose en todas las posiciones del conjunto, sino sólo en algunas (sólo en aquellas que ocupa el volumen de agua):
En este caso, a diferencia del anterior, estudiando el conjunto total, no sabremos la probabilidad de un elemento particular, pues los elementos difieren unos de otros (existe sí, la posibilidad de realizar una sección con los elementos que sí son homogéneos, estudiando el agua o el aceite por separado, ya que el conjunto en este ejemplo esta subdividido en dos subconjuntos heterogéneos entre sí, pero homogéneos cardinalmente, esto es, homogéneos los elementos que los componen).
Podemos, ahora sí, entender qué sucede con la publicación del National Safety Council[10]:
Cuando éste busca responder a la probabilidad de morir, está usando métodos de mecánica estadística, los cuales difícilmente pueden emplearse para los humanos. De hecho, para que fuese un caso ergódico, todo individuo debería de morir miles de veces en un periodo de tiempo, siguiendo estas muertes una proporción similar a la arrojada por el conjunto, muriendo así más veces por ahogo que por bicicleta, por ejemplo.
Uno puede darse cuenta también que, si se estudia la composición de muertes por ahogo en zonas costeras o cercanas a embalses, arrojará resultados distintos a si se estudia en zonas internas y alejadas de la costa. Sin embargo, tampoco de este modo conoceríamos la probabilidad que tiene un individuo de morir ahogado, de hecho, ésta es imposible de conocerse[11].
Sin embargo, lejos de ser de conocimiento común, esto es continuamente ignorado, haciendo que enunciados como “Los alumnos de familias con estudios básicos tienen cinco veces más posibilidades de dejar pronto la escuela”[12] sean comunes, no sólo en el ámbito periodístico, sino también académico, existiendo de hecho infinidad de casos como éste, éste o éste.
Aquí un ejemplo visual de proceso no ergódico, lo que podría ser de nuevo el movimiento de una molécula de agua dentro de un vaso que contiene esta vez, no sólo agua, sino otros líquidos de distinta densidad, de modo que a lo largo del tiempo no termina encontrándose en todas las posiciones del conjunto, sino sólo en algunas (sólo en aquellas que ocupa el volumen de agua):
En este caso, a diferencia del anterior, estudiando el conjunto total, no sabremos la probabilidad de un elemento particular, pues los elementos difieren unos de otros (existe sí, la posibilidad de realizar una sección con los elementos que sí son homogéneos, estudiando el agua o el aceite por separado, ya que el conjunto en este ejemplo esta subdividido en dos subconjuntos heterogéneos entre sí, pero homogéneos cardinalmente, esto es, homogéneos los elementos que los componen).
Podemos, ahora sí, entender qué sucede con la publicación del National Safety Council[10]:
Cuando éste busca responder a la probabilidad de morir, está usando métodos de mecánica estadística, los cuales difícilmente pueden emplearse para los humanos. De hecho, para que fuese un caso ergódico, todo individuo debería de morir miles de veces en un periodo de tiempo, siguiendo estas muertes una proporción similar a la arrojada por el conjunto, muriendo así más veces por ahogo que por bicicleta, por ejemplo.
Uno puede darse cuenta también que, si se estudia la composición de muertes por ahogo en zonas costeras o cercanas a embalses, arrojará resultados distintos a si se estudia en zonas internas y alejadas de la costa. Sin embargo, tampoco de este modo conoceríamos la probabilidad que tiene un individuo de morir ahogado, de hecho, ésta es imposible de conocerse[11].
Sin embargo, lejos de ser de conocimiento común, esto es continuamente ignorado, haciendo que enunciados como “Los alumnos de familias con estudios básicos tienen cinco veces más posibilidades de dejar pronto la escuela”[12] sean comunes, no sólo en el ámbito periodístico, sino también académico, existiendo de hecho infinidad de casos como éste, éste o éste.
El error estriba, como ya dijimos, en utilizar mecánica estadística, empleada para el estudio del movimiento de sustancias homogéneas, es decir, en atomizar a los humanos. Si la actividad humana fuese ergódica, con una muestra de por ejemplo, la intención de voto en un periodo tz, no sólo sabríamos los resultados de un periodo tz+1, sino que todo individuo habría de votar a lo largo de su vida en una proporción similar al conjunto, dado que se parte del supuesto de homogeneidad que permite la aditividad.
Igualmente, en un mundo ergódico, una muestra de los mercados bursátiles en un tiempo tz, nos arrojaría información sobre las probabilidades de cualquier mercado bursátil, pues éstos deberán de reproducirse bajo una probabilidad similar a la proporción de su suma. Ciertamente la sociedad no es ergódica, como tampoco es estacionaria, característica que dejaremos para otro día[13].
Igualmente, en un mundo ergódico, una muestra de los mercados bursátiles en un tiempo tz, nos arrojaría información sobre las probabilidades de cualquier mercado bursátil, pues éstos deberán de reproducirse bajo una probabilidad similar a la proporción de su suma. Ciertamente la sociedad no es ergódica, como tampoco es estacionaria, característica que dejaremos para otro día[13].
[1] "And even if God's
existence is never proved or disproved with certainty one way or the other,
available evidence and reasoning may yield an estimate of probability far from
50 per cent".
The
God delusion, 2006. Richard Dawkins.
[2]
Por supuesto, razonar en términos probalísticos sobre Dios no es más que una
majadería.
[3] "The sword, the sponge,
and the paradox of performativity: some observations on fate, luck, financial
chicanery, and the limits of human knowledge", 2012. David Graeber.
[4]
http://injuryfacts.nsc.org/all-injuries/preventable-death-overview/odds-of-dying/data-details/
[5]
Habitante de Madagascar.
[6]
“Dynamical bias in the coin toss”, 2007. Persi Diaconis, Susan Holmes y Richard Montgomery.
[7]
Por ejemplo, en la medición de una recta, está podrá dar una medida de 1m, pero
podrá seguirse escalando hasta 1´8m, 1´85m, 1´854m, etc. De modo que al medir
lo que hacemos es acotar, por ejemplo, entre 1´854<X<1´853.
Del mismo modo, la probabilidad de un suceso X puede ir decimalmente de 1% a 1´2%, 1´23%, etc.
[8]
Estamos tratándolo desde un punto de vista frecuentista, el cual difiere del
bayesiano.
[9]
Los resultados se han obtenido por simulación a través de Excel.
[10]
Si bien el “National Safety Council” nos informa de que “estas probabilidades
son promedios estadísticos sobre la población de EE.UU. No reflejan las
probabilidades de muerte de una persona en particular por una causa en
particular, que varía significativamente según el estilo de vida, la ocupación,
la residencia y muchos otros factores”, cae en el error de inferir que existe
una probabilidad para cada persona o grupos, lo cual es erróneo.
[11] Esto se debe a que no existen subconjuntos o poblaciones pequeñas donde en éstas las personas sean homogéneas, es decir, no existen dos personas iguales, algo tan cierto como que la muerte sólo sucede una vez (dado que la muerte es un suceso que sólo sucede una vez, es decir,
sólo podemos conocer una tirada por individuo, sería necesario que fuese
un proceso ergódico, obteniendo así, del resultado de varias “tiradas”, la
probabilidad para cada individuo).
Las compañías bancarias, por ejemplo, no pueden saber la probabilidad de que un cliente "x" les produzca pérdidas, si bien pueden trabajar conociendo que un alto porcentaje de individuos con características similares a "x" han sido en el pasado morosos. De este modo, si las circunstancias se mantienen como en el pasado y la compañía está bien administrada, pueden obtener beneficios, pero siempre con el desconocimiento probabilístico de sus clientes.
Las compañías bancarias, por ejemplo, no pueden saber la probabilidad de que un cliente "x" les produzca pérdidas, si bien pueden trabajar conociendo que un alto porcentaje de individuos con características similares a "x" han sido en el pasado morosos. De este modo, si las circunstancias se mantienen como en el pasado y la compañía está bien administrada, pueden obtener beneficios, pero siempre con el desconocimiento probabilístico de sus clientes.
[12]
Se repite en este caso de nuevo, la confusión de creer que cada alumno de familias
con estudios básicos tiene una probabilidad 5 veces superior a dejar la
escuela, con el hecho de que la proporción sea mayor entre estas familias.
[13] Hoy día es, sin embargo, la "regresión lineal" el gran aparato de las ciencias sociales, con el cual se pretende actuar cual físico sobre la sociedad, algo que trataremos también más adelante.
* El título del artículo es un guiño a un artículo de Mark Blaug: "No History of Ideas, Please, We're Economists"
[13] Hoy día es, sin embargo, la "regresión lineal" el gran aparato de las ciencias sociales, con el cual se pretende actuar cual físico sobre la sociedad, algo que trataremos también más adelante.
* El título del artículo es un guiño a un artículo de Mark Blaug: "No History of Ideas, Please, We're Economists"
No hay comentarios:
Publicar un comentario
NO SE ADMITEN COMENTARIOS ANÓNIMOS